C-ORAL-ROM en la tradición lingüística de corpus orales

La Lingüística de Corpus y los Estudios sobre la Lengua Oral son disciplinas independientes, pero estrechamente relacionadas entre sí, que en las últimas décadas del siglo XX lograron finalmente establecerse como líneas de investigación oficiales y consolidadas a nivel institucional dentro de la Lingüística. Tal y como señala, F. Sánchez, atrás quedan los debates del pasado sobre la utilidad de los corpus para extraer principios o reglas gramaticales que caractericen la competencia lingüística. Pocos cuestionan hoy en día las bondades de la Lingüística de Corpus sobre todo en lo que a la creación de un patrimonio lingüístico, de un tesoro cultural, se refiere .
Dentro de este marco, en el año 2001, el Laboratorio de Lingüística Informática comienza su participación en el proyecto de investigación europeo C-ORAL-ROM. El propósito primordial de dicho proyecto consiste en elaborar cuatro corpus en cuatro lenguas romances que posean características de diseño homogéneas, tales como el número de palabras, las situaciones comunicativas seleccionadas para la grabación o el formato de transcripción. Aparte del español, las tres lenguas restantes en las que se elaboraron los corpus fueron el portugués (realizado por la Fundación de la Universidad de Lisboa), el francés (del que se encargó la Universidad de Provenza) y el italiano (a cargo de la Universidad de Florencia).
Estos corpus poseen, respecto de los corpus orales elaborados anteriormente sobre todo en España, una serie de características que han hecho que algunos investigadores los denominaran corpus de segunda generación . Entre dichas diferencias se pueden destacar un mayor cuidado de los aspectos legales (los participantes firman una autorización aceptando la grabación y comercialización de su voz), la calidad de las grabaciones (gracias al avance de la tecnología en este terreno) y aspectos como la representatividad (de género discursivo, en este caso). Veamos con más profundidad algunas características de este proyecto a través del corpus C-ORAL-ROM español.

Add Comment

Your email address will not be published. Required fields are marked *

error: Este contenido está sometido a copyright.