Los marcadores del discurso en el corpus C-Oral-Rom: anotación pragmática, estrategias computacionales de etiquetado y aplicaciones a otros campos

Descripción

En el año 2005, la autora recibe una beca FPI del gobierno de la Comunidad de Madrid para la realización de su tesis doctoral.

AGL realiza su investigación en el marco del proyecto europeo Coral-Rom dedicado a la construcción de corpus orales en las lenguas romances de la Unión Europea.

El objetivo de su tesis consistió en identificar y etiquetar de forma semi-automática los marcadores del discurso del corpus oral del español C-ORAL-ROM, y, en segundo término, mostrar las aplicaciones para la inteligencia artificial y la enseñanza del español a alumnos extranjeros de dicho corpus etiquetado.

Dicha tesis fue terminada en septiembre del 2009 y leída en Enero del 2010.

Una versión revisada de este trabajo será publicada por partes en la web de Siglo XXII y en su totalidad en Amazon bajo el título Los marcadores del discurso del español oral, una aproximación computacional.

Mi tesis en pdf

 

Introducción a esta obra

Parece fuera de toda duda que el funcionamiento del lenguaje dentro de la mente es uno de los retos científicos más importantes del nuevo siglo; no solo por lo que este conocimiento pueda esclarecer sobre el gran misterio del funcionamiento del cerebro, sino por la necesidad que la Inteligencia Artificial tiene de un marco teórico […]

Resumen de la tesis doctoral

PRÓXIMAMENTE

Introducción al capítulo 1: Cognición y lenguaje

Durante la introducción, hemos definido la Pragmática como el campo del saber que estudia el modo en que los seres humanos utilizan el lenguaje en los diferentes contextos de su vida diaria. Es en esta dimensión de la lengua donde más se evidencian las relaciones que el lenguaje guarda con otras dimensiones de la realidad […]

Pensamiento, lenguaje y acción: acciones codificadas y acciones inferidas

La información sobre la realidad representada en la mente se manipula con el fin de hacer una predicción con miras a la acción. En palabras de Jose Antonio Marina : No actuamos para conocer sino que conocemos para actuar […] Lo que define una acción es la intención, el proyecto y plan que los guía. El […]

Verdad, certeza y evidencialidad.

Como sabemos, los conocimientos albergados en nuestra mente sobre el mundo distan mucho de ser científicos . En realidad, en lugar de verdades deberíamos hablar de creencias. Además, a medida que los conocimientos son más abstractos, estas creencias difieren más de un individuo a otro. Fijémonos en que sólo cuando creemos algo pasa a ser verdad […]

La lógica clásica y el sentido común: conectores lógicos y marcadores del discurso

Pasemos ahora a reflexionar sobre el funcionamiento de la mente a la hora de hacer predicciones. Como sabemos, la mente opera de forma inferencial haciendo razonamientos que le puedan conducir a una predicción representada en un valor de verdad. Por ejemplo, analicemos el razonamiento que le escuché en un programa de televisión a una persona […]

La construcción de la intersubjetividad: los observadores observados

Cuando los cuerpos están desnudos, las miradas están vestidas.La presentación de la persona en la vida cotidiana. E. Goffman. Existen muchos estudios dentro de la Ciencia Cognitiva que se han ocupado del problema de la percepción del ser humano. Uno de los más conocidos, como ya señalamos anteriormente, es el de los experimentos realizados sobre […]

La formalización de la intersubjetividad: Formalismo vs. Funcionalismo y Pragmática Computacional

Así pues, ya sabemos qué hay detrás de una metáfora, de una intensificación o de un marcador discursivo como en general. Los enunciados lingüísticos codifican significados referentes a las acciones, la certeza del hablante sobre la verdad de los enunciados, las emociones, y las normas sociales y conversacionales, entre otras cosas. Estos fenómenos responden a un […]

Introducción a la teoría pragmática

A pesar de que fue definida en sus orígenes como el cajón desastre de la semántica, esta disciplina ha gozado de una gran proliferación en las últimas décadas, y la producción bibliográfica en todo su conjunto que existe en torno a las diferentes cuestiones y marcos teóricos de la mismas es cuando menos inabarcable. Ya […]

Raíces filosóficas del movimiento pragmático

En un sentido amplio, pragmatismo o filosofía pragmática hace referencia a una concepción filosófica que defiende no solo una distinción entre teoría y práctica, sino también la primacía de la segunda frente a la primera . En cuanto a corriente filosófica, el pragmatismo se originó a finales del siglo XIX y se desarrolló a lo largo […]

Definiciones del término Pragmática

Dentro de la Lingüística, la definición más antigua de esta disciplina nos llega de la mano de C. Morris en 1938, que además fue el primero en usar este término con su uso contemporáneo. Según este autor, la Pragmática es el estudio de la relación entre los signos y sus intérpretes. Posteriormente, R. Carnap, lógico […]

Relación entre Gramática y Pragmática, Semántica y Pragmática, y Pragmática y otras ciencias

Primero de todo, debemos decir que la bibliografía en torno a esta cuestión es muy extensa, lo cual indica la enorme preocupación que existe dentro de esta comunidad científica por delimitar estos campos; hecho que, dicho sea de paso, puede tener sus consecuencias en la financiación de proyectos de investigación y en la representación a […]

Conceptos de Pragmática: enunciación y enunciado, inferencia, presuposición, implicatura y contexto

A continuación vamos a presentar los conceptos básicos de la teoría pragmática: enunciación y enunciado, inferencia, presuposición, implicatura contexto

Enunciado y enunciación

La teoría de la enunciación, basada en las ideas de Emile Benveniste y enriquecida posteriormente por O. Ducrot, centra al enunciado y no a la oración en el punto de mira análisis lingüístico, ya que estudia todos los fenómenos derivados del análisis de la lengua cuando se emite en un tiempo y espacio determinado y […]

Presuposición e implicatura

La pasada Semana Santa interrumpí mi animada conversación con un gran amigo para pedirle fuego a uno de los dos barrenderos que pasaban por allí. Como el primero me contestó que no, le pregunté al compañero, y este, que tampoco tenía, el lugar de contestarme yo tampoco, sus conocimientos de la lengua española le hicieron responder: yo […]

El concepto de contexto

¿Qué es el contexto? Por un lado, hay un acuerdo general en subrayar la importancia de este concepto para el estudio del uso del lenguaje: La concepción inferencial de la comunicación solo se puede explicar si se tiene en cuenta el contexto. Este contexto siempre es mental y lo forma un conjunto de suposiciones que […]

Pragmática y cognición: La teoría de la Relevancia

Tal y como ya se apuntó en la introducción, comenzamos con la Teoría de la Relevancia porque, a diferencia de las demás, esta teoría ofrece una gran amplitud explicativa sobre el funcionamiento de la comunicación en el ser humano.Creo que para un lector no especializado, la mejor manera de entender lo que propone en términos […]

Teoría de actos de habla: Conceptos Básicos

La Teoría de los Actos de Habla, enunciada en sus orígenes por el filósofo del lenguaje Jean Austin y completada posteriormente por John Searle, es una de las reflexiones existentes más sistemáticas sobre la relación entre el uso cotidiano del lenguaje y el plano de la acción humana. Según Austin, el lenguaje ha sido a […]

El contrato comunicativo: Grice, Levinson, Lakoff

El centro de la investigación de Grice respecto de las oraciones está en el significado del hablante. Al proferir una emisión, un hablante intenta comunicar algo y, a la vez, intenta que su intención comunicativa se reconozca por un oyente: intenta, por ejemplo, inducir en él una creencia o lograr que se lleve a cabo […]

La vertiente social de la comunicación: los seguidores de Grice

Pasemos ahora a revisar los modelos que intentan dar forma a la dimensión social de la comunicación, vertiente que se denomina Pragmática Social y, más concretamente, Cortesía Lingüística. Cuatro autores son tradicionalmente señalados en la bibliografía: R. Lakoff, G. Leech, P. Brown y S. Levinson. Estos autores han pasado a la historia de la Pragmática […]

Un modelo universal de cortesía

El modelo de Brown y Levinson constituye un paso más en la sistematización del modo en que se gestionan las relaciones sociales. Escandell afirma que es el intento más elaborado y estructurado de explicar los motivos de la cortesía en las lenguas, al tiempo que es un buen punto de partida para los interesados en estudiar […]

Teoría de la Argumentación de Anscombre y Ducrot

Dejando al margen de este trabajo una gama muy variada de teorías de la argumentación (para un breve resumen de las mismas recomendamos ) nos centraremos en este apartado en la Teoría de la Argumentación de Anscombre y Ducrot.Para estos autores, la argumentación es un acto cotidiano. Todo acto de lengua argumenta, es más, el uso […]

Teoría pragmática: conclusiones finales

Aquí termina el capítulo dedicado a la exposición de las teorías más importantes del campo de la Pragmática. En España, tenemos representantes de todas las corrientes teóricas presentadas aquí. Destacan especialmente en Teoría de la Argumentación, José Portolés y Marta Tordesillas, en la Universidad Autónoma de Madrid, y Catalina Fuentes en la Universidad de Sevilla. […]

Notas a pie de página del capítulo de teoría pragmática

Aviso al lector en este punto de que usaré la voz de la primera persona del plural para las cuestiones relativas a la narración, mientras que usaré la voz en primera persona del singular para las cuestiones relativas a la opinión, como bien se puede ver en este caso.↩︎ El orden cronológico es: Teoría de […]

Introducción a los marcadores discursivos en las teorías pragmáticas

Con este capítulo entramos en el área de estudio de los marcadores del discurso, uno de los objetos de investigación más importantes no solo para la Pragmática sino también para otras disciplinas afines a ella como la Gramática del Texto, el Análisis Crítico del Discurso o el Análisis Conversacional.El capítulo está dividido en dos grandes […]

Definición de marcador discursivo y características gramaticales

La definición oficial dentro del ámbito académico hispano sobre marcador discursivo es la siguiente: Los marcadores del discurso son unidades lingüísticas invariables, no ejercen una función sintáctica en el marco de la predicación oracional – son, pues, elementos marginales -, y poseen un cometido coincidente en el discurso: el de guiar, de acuerdo con sus […]

¿Qué ha dicho la Pragmática de los marcadores discursivos?

Los marcadores discursivos: relevancia y argumentación Clasificación de los marcadores del discurso La Estructura textual y los marcadores del discurso Marcadores del discurso y cortesía

Los marcadores discursivos: relevancia y argumentación

Desde el marco de la Pragmática, los marcadores discursivos se han visto como modificadores del significado de los enunciados. Leamos las palabras de M. Zorraquino al respecto: El concepto de marcador discursivo remite a aquellas palabras que hacen referencia al proceso de enunciación, donde influye la posición del hablante con respecto a lo que está […]

Clasificación de los marcadores del discurso

A continuación, presentamos una de las clasificaciones más sistemáticas que se han presentado dentro de los estudios de marcadores discursivos en español en el mundo académico hispanohablante. Existen otras tipologías como las ofrecidas por L. Cortés , A. Briz o C. Fuentes 2, pero buena parte de los criterios de estas clasificaciones son de naturaleza estructural, esto es, […]

Marcadores del discurso y cortesía

Por último, nos referiremos, muy brevemente, a otra parte de los estudios sobre marcadores del discurso que se ha centrado en estudiar la dimensión que su significado tiene en el nivel social de la lengua. Así por ejemplo, si pensamos en la negociación de las imágenes públicas de las identidades de los participantes que tiene […]

Los marcadores discursivos, Lingüística Computacional e Inteligencia Artificial

Después de haber explicado las aportaciones teóricas más relevantes entorno al significado, función y dimensiones de análisis de esta categoría pragmática, nos gustaría introducir al lector, para finalizar este capítulo, en la aplicación que de este conocimiento se ha llevado a cabo en el mundo de la Lingüística Computacional (LC) y de la Inteligencia Artificial […]

Relaciones de coherencia, relaciones retóricas y marcadores del discurso

He terminado la sección anterior aludiendo a las críticas que desde el terreno computacional se están arguyendo en torno a la cuestión que se rotula en este apartado. De nuevo, no deja de ser bastante sintomático de estas carencias de comunicación entre Lingüística Computacional y Lingüística el hecho de que un sector considerable de la […]

Final de la parte teórica de la tesis

Hemos expuesto brevemente en este capítulo las características definitorias de los marcadores discursivos a nivel teórico, y hemos hecho algunas puntualizaciones críticas que luego tendrán su correspondiente reflejo en nuestro sistema de anotación y el anotador semi-automático de marcadores del discurso.Con este capítulo pues abandonamos la primera parte de la tesis, dedicada a la exposición […]

Concepción teórica del modelo de anotación pragmática

Como ya se apuntó en el capítulo primero, la motivación principal que sostiene este trabajo de tesis es la reflexión sobre el posible tratamiento que se le puede dar desde una perspectiva computacional a esta nueva consideración cognitivo-social y pragmática del lenguaje.En español, los fenómenos que vamos a tratar se manifiestan a través de recursos lingüísticos que […]

Descripción de los fenómenos semántico-pragmáticos de PRAGMATEXT

A continuación, presentamos una breve descripción de los siguientes fenómenos: Lenguaje emocional Relaciones discursivas Modalización lingüística Evidencialidad Deixis Actos de habla Metáforas y unidades fraseológicas La exposición de cada fenómeno va a seguir siempre la misma estructura discursiva: Descripción del fenómeno. Sistematización del mismo en el modelo de anotación, Pragmatext. Ejemplos de categorías gramaticales que […]

La codificación verbal de las emociones

La palabra emoción viene del latín emotio, que significa el impulso que induce la acción. En buena parte de la tradición filosófica, las dimensiones de la experiencia cognitiva intelectual o racional fueron consideradas separadas y superiores a la emocional o sentimental. Paralelamente se estableció que el conocimiento y la razón pertenecen al hombre mientras que las emociones y los […]

Las operaciones argumentativas

Argumentar es la estrategia por medio de la cual un hablante, expresándose en una lengua natural, llega a sacar conclusiones válidas (Stati 1990, en Fuentes ). Para Ducrot y Anscombre , argumentar es dar a A una razón para creer C. En este trabajo, estamos interesados en la argumentación como un proceso cognitivo de organización del razonamiento . Las […]

Generalización y Concreción

Las operaciones de generalización y concreción 5 discursiva responderían en el nivel cognitivo con el pensamiento inductivo y deductivo, dos de los razonamientos claves en las computaciones que el cerebro realiza durante el procesamiento de información. Los procesos de metáfora y los refranes son ejemplos del uso cognitivo de estos dos tipos de razonamiento, como se explicará […]

Coargumentación, Contraargumentación, Concesión y Opcionalidad

La coargumentación y la contraargumentación6 son dos tipos de operaciones que encuentran su trasfondo teórico en la Teoría de la Argumentación. Según dicha teoría, los enunciados tienen un peso argumentativo a la hora de conducir a determinadas verdades o conclusiones sobre la realidad. Los enunciados que aumentan el peso argumentativo de otros estarán orientados, mientras que aquellos […]

Hipótesis y condición

Tanto la hipótesis 7 como la condición han sido bastante estudiadas tanto en Lingüística como en Lógica a partir de la partícula si. De hecho, buena parte de los estudios consultados están dedicados a comparar el si de las lenguas naturales con el si lógico. Sin embargo, al igual que en el caso de las conjunciones, los estudios en Pragmática tampoco han […]

Causa y consecuencia

La causalidad 8 está considerada como una categoría de pensamiento. Los estudios clásicos de Piaget sobre el funcionamiento de la causalidad durante el desarrollo cognitivo del niño son una buena muestra de la atención científica que ha recibido este fenómeno. Si tal y como es sobradamente entendido, el pensamiento racional se basa en la causalidad, no es […]

Reformulación

La reformulación 9 es una operación discursiva mediante la cual el hablante explicita inferencias haciendo que un enunciado sea una paráfrasis del anterior . La bibliografía ha distinguido diferentes tipos de operaciones de reformulación, algunas de las cuales conviven dentro de un mismo marcador, como es el caso de o sea, por ejemplo . En Pragmatext, solo vamos a marcar […]

Topicalización

Pertenecen a esta clase las formas lingüísticas 10 que convierten en tópico una agrupación o chúnker de información determinada.Las categorías gramaticales encargadas de llevar a cabo estas funciones son: sintagmas nominales y preposicionales.Algunos ejemplos de formas lingüísticas en las que se materializan esta operación son: respecto a, con referencia a, respecto de, etc.A continuación presentamos un ejemplo en lenguaje XML:

Síntesis y Conclusión

Ante las dificultades de la bibliografía para distinguir nítidamente entre una y otra operación discursiva, hemos decidido hacer una gran clase11 donde se incluyan todos los marcadores que sirvan para concluir el discurso, bien a modo de resumen, bien a modo de conclusión.Las categorías gramaticales encargadas de llevar a cabo estas funciones son: nombres, adverbios y sintagmas preposicionales.Algunos ejemplos […]

La planificación del discurso

Entran dentro de este tipo 12 todas las formas lingüísticas que se ocupan de sostener y planificar la intervención verbal.encargadas de llevar a cabo estas funciones son: signos paralingüísticos, sintagmas verbales y preposicionales.Algunos ejemplos de formas lingüísticas en las que se materializan esta operación son: &ah y &eh.A continuación presentamos un ejemplo en formato XML:

Digresión

La digresión 13 es la operación discursiva mediante la cual se presenta una secuencia o enunciado que se aparta del hilo discursivo principal y que ha sido sugerida por algo que se acaba de decir; suele ser espontánea o no planificada. En se caracteriza como una operación que abre una puerta temática de carácter breve, pero debemos recordar […]

Escalaridad

Conforman esta clase 15 los marcadores que tienen un significado escalar que ya explicamos en el capítulo dos.Categorías gramaticales: adverbios.Ejemplos de formas lingüísticas: inclusive, incluso.Ejemplo en formato XML:

Marco

En nuestro modelo de anotación, el marco 16 es una operación de enmarcación contextual a través de la cual se expresa que la verdad de dicho enunciado solo es válida dentro de las condiciones que impone el marco.Las categorías gramaticales encargadas de llevar a cabo estas funciones son: adverbios y sintagmas preposicionales.Algunos ejemplos de formas lingüísticas en las que se materializan […]

La modalización discursiva

La modalización discursiva ha sido objeto de estudio de diferentes ramas del conocimiento, desde la Filosofía hasta la Pragmática. A pesar de que la Lógica y la Semántica formal diferencia entre distintos tipos de modalidad, solo nos vamos a centrar en la epistémica, y en Pragmatext, la llamaremos modalización para aludir al proceso de moldeamiento […]

La evidencialidad

Dentro de la tradición lingüística hispánica, se llama evidencialidad al dominio semántico relacionado con la expresión de la fuente de información, y, evidencial o marcador evidencial, a la forma lingüística específica que cumple esta función. Por ejemplo, la lengua tuyuca, lengua de la familia tucanao hablada en Venezuela, presenta afijos flexivos obligatorios que se adosan […]

Deixis

Por deixis 19 entendemos la referencia a elementos espacio-temporales del contexto o de la situación comunicativa en la que tiene lugar una interacción verbal.De cara al modelo de anotación, voy a diferenciar entre dos tipos de deixis: la deixis discursiva, esto es, la referencia a otras partes del texto, y la deixis social o referencia al interlocutor.Las categorías […]

Actos de habla

La cuestión más relevante que podemos tocar en este apartado una vez ya presentadas en el capítulo anterior las bases generales de la teoría, es el tema de la tipología de los actos de habla, por un lado, y el de la relación entre fuerza ilocutiva y forma lingüística por otro; sobre todo en lo […]

Metáfora y Unidades Fraseológicas

Morir mártir es inyectar sangre en las venas de nuestra sociedad.Persépolis. Marjane Satrapi. George Lakoff y Mark Johnson pertenecen a la segunda generación de la Ciencia Cognitiva y reivindican una filosofía empíricamente responsable. Para sus investigaciones, se apoyan en los resultados de la Ciencia Cognitiva y en las teorías neuronales del lenguaje. Fundamentalmente, estos autores […]

Conclusión al capítulo 4 de la tesis

En este capítulo, hemos explicado el modelo de anotación pragmática de corpus, sus presupuestos teóricos y una descripción de cada uno de sus fenómenos partiendo de su origen cognitivo-social hasta su materialización en las formas lingüísticas etiquetadas por PRAGMATEXT en lenguaje XML.Como sabemos, una de las cualidades que confieren validez a los modelos tiene que […]

Los marcadores discursivos de C-ORAL-ROM clasificados con PRAGMATEXT: intro

Antes de mostrar las tablas de clasificación de unidades de información pragmática procedentes del corpus C-ORAL-ROM, me gustaría dedicar la primera parte de este capítulo a desarrollar más detenidamente algunas cuestiones ya presentadas en la parte final del capítulo tres relacionadas con los problemas teóricos y computacionales de los marcadores discursivos.

Pragmatext y los marcadores discursivos

Ya hemos mencionado en más de una ocasión que en este trabajo hemos intentado trazar un puente de comunicación entre estas dos disciplinas, la Pragmática Lingüística y la Pragmática Computacional, en lo que al tratamiento de los marcadores discursivos se refiere. Siempre bajo la premisa de llegar a una solución de compromiso a la hora […]

Etiquetado en XML

A continuación, vamos a glosar más detenidamente la formalización del modelo de anotación en formato XML; información que se adelantó en el capítulo anterior con el fin de que el lector observara la transición desde la concepción teórica hasta su anotación formal.Sobre un marcador del discurso se explicitará la siguiente información: Un rasgo que señale […]

Los marcadores del discurso de C-ORAL-ROM clasificados con PRAGMATEXT: marcadores de operaciones discursivas

MD UFS MET SD TD DR ED MOD EVI SA DEX en general Loc No No No Generalization No No No No No eso es como todo Col No No No Generalization No No Inference No No normalmente No Sí No No Generalization No No Inference No No por lo general Loc No No No […]

Los marcadores del discurso de C-ORAL-ROM clasificados con PRAGMATEXT: marcadores de evaluación emocional

SI ESTÁS INTERESADO EN ESTA INFORMACIÓN, PONTE EN CONTACTO CON LA AUTORA.

Los marcadores del discurso de C-ORAL-ROM clasificados con PRAGMATEXT: Marcadores de Evidencialidad

SI ESTÁS INTERESADO EN ESTA INFORMACIÓN, PONTE EN CONTACTO CON LA AUTORA.

Los marcadores del discurso de C-ORAL-ROM clasificados con PRAGMATEXT: marcadores de modalización discursiva, atenuantes e intensificadores

SI ESTÁS INTERESADO EN ESTA INFORMACIÓN, PONTE EN CONTACTO CON LA AUTORA.

Marcadores de Deixis etiquetados con Pragmatext

PARA ACCEDER A ESTA INFORMACIÓN, CONTACTA CON LA AUTORA EN LA PÁGINA DE CONTACTO.

Marcadores de Actos de Habla etiquetados con PRAGMATEXT

MOSTRAMOS UN EJEMPLO DE LOS DATOS. PARA ACCEDER A ESTA INFORMACIÓN, CONTACTA CON LA AUTORA EN LA PÁGINA DE CONTACTO. MD UFS MET SD TD DR ED MOD EVI SA DEX verás No Sí No No No No No No Commitment Social Interlocutor que en paz descanse Col No No No No No No No […]

Final del capítulo 5

Aquí termina la clasificación de las unidades con información pragmática de C-ORAL-ROM. Para un estudioso de la Pragmática dicha clasificación no va a ser suficiente e incluso puede llegar a considerar simplista; sin embargo es bastante rica en relación a lo que se ha hecho hasta el momento en Lingüística Computacional en lo que respecta […]

Lingüística de corpus y anotacion pragmática: C-ORAL-ROM y Pragmatext: intro

Este capítulo está dedicado a enmarcar nuestro trabajo dentro de la disciplina de Lingüística de Corpus. Hemos dividido la exposición de los conocimientos en tres grandes partes. En la primera, presentamos las características de diseño más interesantes del corpus con el que vamos a trabajar, al tiempo que lo insertamos dentro las líneas de investigación […]

C-ORAL-ROM en la tradición lingüística de corpus orales

La Lingüística de Corpus y los Estudios sobre la Lengua Oral son disciplinas independientes, pero estrechamente relacionadas entre sí, que en las últimas décadas del siglo XX lograron finalmente establecerse como líneas de investigación oficiales y consolidadas a nivel institucional dentro de la Lingüística. Tal y como señala, F. Sánchez, atrás quedan los debates del pasado sobre la utilidad […]

El corpus oral del español C-ORAL-ROM: diseño y características

El corpus C-ORAL-ROM tiene aproximadamente unas 300.000 palabras. Desde un punto de vista macroestructural, en las transcripciones podemos diferenciar dos grandes bloques: la cabecera y la transcripción propiamente dicha del sonido de la grabación. A continuación explicaremos las características más importantes de cada uno de estos bloques en sendos subapartados.

Las cabeceras de las transcripciones

En la cabecera se recoge información de naturaleza contextual clasificada en los siguientes campos:@Title: un breve título@File: el nombre del archivo@Participants: los datos sobre los participantes siglas que marcarán sus intervenciones en el texto, nombre por el que le llaman los otros interlocutores, género (man/woman), edad A para de 18 a 25 años B de […]

Las transcripciones

En la tabla siguiente se recogen los signos de transcripción más importantes para la comprensión de las transcripciones: |p1cm|p7cm|p7cm| Signo & Definición & Ejemplo * Tres mayúsculas: & Comienzo de turno. Las siglas coincidirán con la que se les ha asignado al interlocutor en la cabecera & *ABC: *XZY: & En caso de que no […]

La anotación del corpus C-ORAL-ROM: niveles de anotación y formatos

C-ORAL-ROM consta de cuatro versiones del corpus cada una con diferentes niveles de etiquetado. La primera es en formato texto y refleja el sistema de transcripción hasta aquí mostrado. La segunda muestra en XML las marcas de alineamiento con el sonido de la grabación. Después hay una versión de C-ORAL-ROM – en formato MULTEXT y […]

Coralrom en formato XML

Formato de transcripción en XML

Formato de alineamiento en XML

<?xml version="1.0" encoding="iso-8859-1"?> <!DOCTYPE Alignment SYSTEM "coralrom.dtd"> <Alignment> <TimeStamp Value="Wednesday, November 20, 2002 time 12h 04m 50s"/> <WinPitch Program="Aligner" Version="1.0"/> <Trans version="1.0" creationDate="Wednesday, November 20, 2002 time 12h 04m 50s" audioFilename="efamcv10.wav" textFilename="efamcv10.txt"/> <Layer1 Name="ELE" ID="ELE" Short="ELE" Color="RGB(145,213,110)"/> <Layer2 Name="ANA" ID="ANA" Short="ANA" Color="RGB(213,145,220)"/> <Layer3 Name="ANT" ID="ANT" Short="ANT" Color="RGB(145,145,213)"/> <Layer4 Name="SEV" ID="SEV" Short="SEV" Color="RGB(228,228,228)"/> <Layer5 Name="Layer 5" [...]

Coralrom etiquetado a nivel categorial: el modelo MULTEXT

Todos los corpus que conforman el proyecto C-ORAL-ROM están etiquetados con este modelo de anotación, aunque solamente nosotros distinguimos desde los inicios la categoría marcador del discurso.

Coralrom etiquetado en XML a nivel semántico-eventivo

PRÓXIMAMENTE

Corpus anotados a nivel semántico-pragmático

En lo que respecta al nivel semántico-pragmático de la lengua, solamente podemos destacar en el ámbito del español dos corpus que tienen anotación semántica. En primer lugar, el corpus Cast3lb , etiquetado con Named Entities, papeles semánticos (que se corresponden con su respectiva función sintáctica) y relaciones anafóricas; y, en segundo lugar, nuestro corpus, C-ORAL-ROM, anotado […]

Pragmatext en C-ORAL-ROM en formato XML

Este apartado está dedicado a explicar el formato de la transcripción de C-ORAL-ROM etiquetado en XML con Pragmatext. En el capítulo cinco ya hemos adelantado el modo en que aparecen etiquetadas las unidades de información pragmática en XML. Aquí damos una explicación global al texto de la transcripción.Como ya sabemos, la información pragmática se ha […]

Estrategias de reconocimiento y clasificación semiautomática de los marcadores del discurso del corpus C-ORAL-ROM, el anotador DiMaSTagger y su evaluación: INTRODUCCIÓN

n este capítulo, vamos a tratar todas las cuestiones relativas a la gestión computacional del corpus a la hora de reconocer estas palabras e introducir las etiquetas en XML que hemos diseñado para los marcadores en el corpus.El tratamiento automático de los marcadores del discurso es una tarea de reciente en la investigación de Lingüística […]

Fase de preanotación (1): Elaboración del lexicón de marcadores del discurso 

Nuestro lexicón de marcadores discursivos se ha elaborado con las siguientes fuentes: Las obras de J. Portolés, L. Cortés, Mª.A. M. Zorraquino y C. Fuentes , , , , , , . El lexicón de interjecciones del DRAE . El lexicón que durante la etapa del etiquetado automático morfosintáctica del corpus y su validación manual había originado discusiones dentro del grupo de investigación […]

Reconocimiento de los candidatos a MD en el corpus

Tenemos que tener en cuenta que esta lista que hemos elaborado en realidad no es una lista de marcadores del discurso sino que es una lista de palabras que son candidatas posibles a que en el corpus sean realmente marcador discursivo. Así por ejemplo, algunas palabras de la lista no estarán, otras estarán pero posiblemente […]

ÍNDICE DE LA OBRA

  • Abstract

  • Introducción a la obra

  • PARTE I: DE LA TEORÍA

  • PARTE II: DE LA DESCRIPCIÓN

    • Capítulo 4: Pragmatext, un modelo de anotación pragmática para corpus.

    • Capítulo 5: Clasificación semántica de los marcadores del discurso del corpus oral del español C-ORAL-ROM.

  • PARTE III: DEL PROCESAMIENTO

    • Capítulo 6: Lingüística de corpus y anotación pragmática: C-ORAL-ROM y PRAGMATEXT

    • Capítulo 7: Estrategias de reconocimiento y clasificación semiautomática de los MMDD del corpus CORALROM: El anotador DIMASTAGGER y su evaluación

  • PARTE IV: DE LA APLICACIÓN

    • Capítulo 8: Los MMDD en C-ORAL-ROM, entre la oralidad y la escritura, una análisis de corte cuantitativo

    • Capítulo 9: La enseñanza por ordenador de lso MMDD a los alumnos italianos con CORALROM, un corpus de español oral

  • PARTE V: DE LA INTERPRETACIÓN

    • Capítulo 10: Inteligencia artificial y pragmática: perspectivas de investigación

    • Conclusiones finales y trabajo futuro

Valoraciones

No hay valoraciones aún.

Sé el primero en valorar “Los marcadores del discurso en el corpus C-Oral-Rom: anotación pragmática, estrategias computacionales de etiquetado y aplicaciones a otros campos”

Tu dirección de correo electrónico no será publicada.

error: Este contenido está sometido a copyright.