Hace ya un tiempo hablamos en nuestro blog sobre los corpus lingüísticos y su utilidad para profesionales, no solo de la traducción, sino para otros cuya ocupación se relaciona con el manejo de palabras, textos o documentos. El hecho de disponer de glosarios específicos agiliza y facilita la labor. Es cierto que no es fácil encontrar corpus demasiado especializados, centrados en materias concretas o poco comunes, pero también es cierto que en los existentes, pueden incluirse multitud de términos que quizá sean los que buscamos.
Por ello, vamos a incluir en nuestro listado, una serie de enlaces a esos corpus lingüísticos que harán nuestro trabajo mucho más sencillo.
Real Academia de la Lengua:
- Corpus del español del siglo XXI – Corpes XXI
- Corpus de referencia del español actual – CREA
- Corpus diacrónico del español – CORDE
- Biblioteca virtual de la Lengua de Signos – CNLSE, Corpus Lengua de Signos
Corpus en otros idiomas:
- British National Corpus – BNC
- The Oxford English Corpus – OEC
- Corpus of Contemporary American English – COCA
- The Open American National Corpus – ANC
- Leibniz-Institute für Deutsche Sprache – DeReKo
- Corpus Search, Management and Analysis System (alemán) – COSMAS II
- Corpus Nacional de la Lengua Rusa – RUSCORPA
En la página de la Universidad de Cádiz (UCA) podemos encontrar enlaces a corpus más específicos o concretos:
- Corpus de textos bilingües Inglés-español, español-inglés – ACTRES
- Corpus formado con términos obtenidos en discursos del parlamento británico – HANSARD
- Corpus con vocabulario de habla infantil de diversos idiomas – CHILDES
- Corpus centrado en el aspecto fonológico proveniente de muestras obtenidas por estudiantes de español de origen extranjero – Fono.Ele
- Traitement de Corpus Oraux en Français. Corpus formado con materiales obtenidos de conversaciones de todo tipo entre hablantes de lengua francesa. Los filtros permiten una amplia selección de contextos – TCOF
- Corpus denominado News of the Web, en el que podemos encontrar vocabulario obtenido de periódicos y revistas – NOW
- Corpus desarrollado a partir de textos filosóficos y literarios – FRANTEXT
- Corpus de Français Parlé Parisien des années 2000 – CFPP 2000
- Corpus de la Langue Parlée en Interaction – CLAPI
- Corpus oral de la lengua española contemporánea elaborado por la Universidad Autónoma de Madrid y centrado, principalmente en el aspecto conversacional – CORLEC
Otros bancos de datos o corpus que pueden resultar útiles:
- European Parliament Proceedings Parallel Corpus 1996-2011 – EUROPARL
- Repositorio TalkBank, centrado en la comunicación oral, en el que se pueden encontrar muestras de multitud de áreas de investigación – TALKBANK
- Corpus de textos literarios en lengua croata – Literature. Textos periodísticos – Journal
- Proyecto SemLink, desarrollado por la Universidad de Colorado y desde cuyo portal se puede acceder a varios corpus o Lexicon de diversos tipos: semánticos, gramaticales, etc. – SEMLINK
Etiquetado:lingüística
Deja una respuesta