Marcadores discursivos en árabe y español: un estudio computacional basado en corpus paralelos con anotación pragmática

Investigación desarrollada con el mismo grado de autoría por la autora y por la investigadora egipcia Doaa Samy, premiada en 2020 por el gobierno Egipcio por su labor investigadora y miembro del grupo que lidera el Plan de Tecnologías del Lenguaje del gobierno español.

Esta investigación fue desarrollada en el año 2008, cuando ambas investigadoras estaban realizando sus respectivas tesis en el Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid.

Dicho trabajo consistió en aplicar el sistema de clasificación semántico-pragmática que había elaborado la autora durante su tesis para etiquetar los marcadores del discurso del corpus CORAL ROM al corpus paralelo español-árabe de la ONU con el que Doaa Samy estaba trabajando para su tesis doctoral.

El resultado de la investigación se presentó en el congreso de Lingüística General de la UAM, denominado El valor de la diversidad lingüística y posteriormente fue publicado en inglés. Trabajo que también se puede consultar desde este sitio web.

Estructura de la investigación:

1) Estado de la cuestión

a) La traduccion
b) El procesamiento del lenguaje natural a nivel discursivo
c) Los corpus paralelos
d) El árabe

2) El nivel pragmático de la lengua:

a) Los marcadores del discurso
b) Clasificación en función de la fuerza argumentativa

3) Procesamiento computacional del discurso

a) nuestro corpus
b) reconocimiento, clasificación y etiquetado de los mds
c) evaluación

4) Aplicaciones: ayuda a la traduccion y a ele

a) aprende a argumentar en otra lengua
–del fenómeno a la palabra
b) lista de conectores según su clasificación
c) ejemplos del corpus

 

Doa_UAMultimaversion

Estamos subiendo contenido a esta página. Disculpen las molestias.

Entendido
X