Ejemplo de transcripción oral: Elia y la piscina del chalé de tío Faustino

  En el año 1999, la autora realiza una grabación en su entorno familiar para la asignatura Análisis de la conversación, dentro de la Licenciatura de Filología Hispánica cursada en la UAM. Aquí se muestra la transcripción de la grabación.   transcripción

Los marcadores del discurso en el corpus C-Oral-Rom: anotación pragmática, estrategias computacionales de etiquetado y aplicaciones a otros campos

En el año 2005, AGL recibe una beca FPI del gobierno de la Comunidad de Madrid para la realización de su tesis doctoral. AGL realiza su investigación en el marco del proyecto europeo Coral-Rom dedica a identificar y clasificar las partículas discursivas en un corpus oral del español. La tesis doctoral fue leída en el mes de enero del año 2010. Una versión revisada de este trabajo será publicada posteriormente en Amazon.

Hacia un etiquetado sintáctico del corpus oral del español C-ORAL-ROM

Tesina o trabajo de posgrado realizado para obtener el diploma de Estudios Avanzados en la especialidad de Lingüística en el año 2005, en el departamento de Lingüística, lenguas modernas, Retórica y Teoría de la Literatura de la Universidad Autónoma de Madrid. En este trabajo, la autora se adentra en el mundo de la anotación sintáctica de corpus, y aborda los problemas que conlleva el etiquetado de enunciados en la sintaxis oral de la lengua española. Una posterior versión será publicada en Amazon próximamente.

The Spanish Corpus

The Spanish Corpus es un capítulo dentro del libro C-ORAL-ROM Integrated Reference Corpora for Spoken Romance Languages en el que se describe el diseño y el proceso de realización del corpus oral en lengua española por parte del grupo de investigación del Laboratorio de Linguistica Informática de ese momento. Esta publicación supone una de las publicaciones más relevantes del equipo de investigación. Abajo, ponemos la referencia bibliográfica por si el lector tiene interés en leer su contenido.   MORENO, A., DE LA MADRID, G., ALCÁNTARA, M., GONZÁLEZ, A. y DE LA TORRE, R. “The Spanish Corpus”. En: Cresti y Moneglia (eds.). C-ORAL-ROM Read More

C-ORAL-ROM. Corpus integrado de referencia en lenguas romances

Artículo publicado por el grupo de investigación del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid en la revista Procesamiento de lenguaje natural del 2003 en el que se describe el proyecto de investigación europeo C-ORAL-ROM, y se narran el modo en que se realizó el corpus español de lengua oral así como sus características de diseño.   corpus_integrado

Relating Lexical Items to Sociolinguistic Features in a Spontaneous Speech Corpus of Spanish

En el año 2003, el laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid presenta una investigación conjunta en el congreso llamado Corpus Lingüistics de Lancaster, en Birmingham (Reino Unido). En dicha investigación, relacionan frecuencias de léxico con categorías o rasgos sociolingüísticos como la edad y el género en el corpus oral del español C-ORAL-ROM.    

Orality and Difficulties in the Transcription of Spoken Corpora

En el año 2004, el grupo de investigación del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid acude al congreso LREC (The International Conference on Language Resources and Evaluation) con un trabajo de investigación en el que describen la primera etapa de creación del corpus oral del español C-ORAL-ROM, atendiendo sobre todo a los problemas que comporta la transcripción de la oralidad.    

Los marcadores del discurso en CHIEDE, un corpus de habla infantil

En el año 2007, el estudio de los marcadores del discurso en el habla infantil es un tema aún poco desarrollado por la pragmática española y, más aún, dentro de los corpus de habla oral. Gracias al corpus oral de habla infantil desarrollado por la científica investigadora Marta Garrote Salazar durante su tesis doctoral, pudo llevarse a cabo el etiquetado del corpus desde un punto de vista discursivo, a partir del cual se pudieron extraer las frecuencias de uso de dichas partículas discursivas en el habla de los niños, una información en su tiempo de enorme relevancia significativa que puede Read More