Recursos de traducción: los corpus lingüísticos generales

Nos gustaría comenzar el mes de junio compartiendo con los clientes, amigos y seguidores del blog de ABC Translink un nuevo artículo dedicado a los recursos lingüísticos, esas interesantes herramientas que son útiles tanto para los traductores de nuestro equipo de colaboradores como para cualquier profesional que trabaje con las palabras. Hasta ahora hemos hablado de diccionarios, glosarios, enciclopedias, guías gramaticales, etc., instrumentos que todo el mundo más o menos conoce, pero hoy vamos a dar un paso más y vamos a adentrarnos en el menos conocido mundo de los corpus lingüísticos.

Corpus lingüísticos

¿Qué es un corpus lingüístico?

De forma genérica podríamos definir un corpus lingüístico como un conjunto extenso y ordenado de datos que nos permiten investigar detenidamente las características de una lengua, de un idioma. Los lingüistas afirman que existen dos tipos de corpus: los orales y los textuales. Dentro de este último grupo de corpus encontramos también dos tipos diferentes: los corpus generales y los específicos. El mismo nombre nos da la pista para diferenciar bien unos de otros; los generales recopilan datos generales de una lengua y los específicos ahondan en aspectos concretos de la gramática, el léxico, etc.

Hoy vamos a ver algunos de los mejores ejemplos de corpus lingüísticos generales, herramientas que utilizamos habitualmente en los trabajos de traducción de ABC Translink cuando debemos trasladar textos redactados en inglés, francés, árabe, italiano, portugués o alemán al segundo idioma más hablado del mundo, el español.


CREA

Uno de los corpus lingüísticos más conocidos por los lexicólogos del castellano está firmado por la Real Academia de la Lengua Española. CREA son las siglas de Corpus de Referencia del Español Actual y, como su propio nombre indica, recoge textos literarios y fragmentos del español común que llevamos hablando en España, Argentina, Bolivia, Chile, Costa Rica y el resto de países hispano hablantes desde el año 1975.

 

CUMBRE  

CUMBRE es un corpus lingüístico conocido por los traductores y profesores de lengua española por ser el primer corpus que se utilizó en el mundo para crear un diccionario. Esta completa base de datos contiene más de 20 millones de las palabras con las que nos comunicamos a diario en los diferentes países de habla hispana y es tan útil que hasta la empresa Microsoft se ha mostrado interesada en adquirirlo para utilizarlo en sus diccionarios y sistemas de corrección automática.

 

ARTHUS 

ARTHUS se autodefine como una base de datos sintácticos del español actual. Se trata de un proyecto en proceso de desarrollo promovido por la Universidad de Santiago de Compostela y que recoge textos y fragmentos de todo tipo: artículos periodísticos, novelas, ensayos, etc. Actualmente se encuentra en fase de desarrollo y cuenta por el momento con más de 3 millones de entradas.

 

AGLE http://cvc.cervantes.es/lengua/agle/

No podía faltar en la lista de ABC Translink un interesante proyecto firmado por el Centro Virtual Cervantes, el corpus gramatical AGLE o Archivo Gramatical de la Lengua Española. Según leemos en su página web, este corpus recoge todas las fichas creadas a lo largo de los años por uno de los gramáticos más importantes de la historia de nuestro idioma, el miembro de la RAE don Salvador Fernández Ramírez (1896-1993).

 

¿Quieres compartir con nosotros tu corpus lingüístico favorito?  

¡Participa!

Etiquetado:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *