Corpus lingüísticos: enlaces útiles

Hace ya un tiempo hablamos en nuestro blog sobre los corpus lingüísticos y su utilidad para profesionales, no solo de la traducción, sino para otros cuya ocupación se relaciona con el manejo  de palabras, textos o documentos. El hecho de disponer de glosarios específicos agiliza y facilita la labor. Es cierto que no es fácil encontrar corpus demasiado especializados, centrados en materias concretas o poco comunes, pero también es cierto que en los existentes, pueden incluirse multitud de términos que quizá sean los que buscamos.

Por ello, vamos a incluir en nuestro listado, una serie de enlaces a esos corpus lingüísticos que harán nuestro trabajo mucho más sencillo.

Real Academia de la Lengua:

  • Corpus del español del siglo XXI – Corpes XXI
  • Corpus de referencia del español actual – CREA
  • Corpus diacrónico del español – CORDE

Corpus en otros idiomas:

  • British National Corpus – BNC
  • The Oxford English Corpus – OEC
  • Corpus of Contemporary American EnglishCOCA
  • The Open American National Corpus – ANC
  • Leibniz-Institute für Deutsche Sprache – DeReKo
  • Corpus Search, Management and Analysis System (alemán) – COSMAS II
  • Corpus Nacional de la Lengua Rusa – RUSCORPA

En la página de la Universidad de Cádiz (UCA) podemos encontrar enlaces a corpus más específicos o concretos:

  • Corpus de textos bilingües Inglés-español, español-inglés – ACTRES
  • Corpus formado con términos obtenidos en discursos del parlamento británico – HANSARD
  • Corpus con vocabulario de habla infantil de diversos idiomas – CHILDES
  • Corpus centrado en el aspecto fonológico proveniente de muestras obtenidas por estudiantes de español de origen extranjero – Fono.Ele
  • Traitement de Corpus Oraux en Français. Corpus formado con materiales obtenidos de conversaciones de todo tipo entre hablantes de lengua francesa. Los filtros permiten una amplia selección de contextos – TCOF
  • Corpus denominado News of the Web, en el que podemos encontrar vocabulario obtenido de periódicos y revistas – NOW
  • Corpus desarrollado a partir de textos filosóficos y literarios –  FRANTEXT
  • Corpus de Français Parlé Parisien des années 2000 – CFPP 2000
  • Corpus de la Langue Parlée en Interaction CLAPI
  • Corpus oral de la lengua española contemporánea elaborado por la Universidad Autónoma de Madrid y centrado, principalmente en el aspecto conversacional – CORLEC

Otros bancos de datos o corpus que pueden resultar útiles:

  • European Parliament Proceedings Parallel Corpus 1996-2011 – EUROPARL
  • Repositorio TalkBank, centrado en la comunicación oral, en el que se pueden encontrar muestras de multitud de áreas de investigación – TALKBANK
  • Corpus de textos literarios en lengua croata – Literature. Textos periodísticos – Journal
  • Proyecto SemLink, desarrollado por la Universidad de Colorado y desde cuyo portal se puede acceder a varios corpus o Lexicon de diversos tipos: semánticos, gramaticales, etc. – SEMLINK

Etiquetado:

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *