Pragmatext, un modelo de anotación pragmática para corpus

  • Principios teóricos

A continuación presentamos muy resumidamente los cimientos teóricos en los que se sustenta nuestro modelo de anotación. Las fuentes de conocimiento en las que está basada esta concepción teórica pertenecen a los últimos descubrimientos en el estudio de la interacción mente-cuerpo por parte de las Ciencias Cognitivas (incluyendo la Lingüística Cognitiva), el conocimiento construido por la Pragmática Lingüística (sobre todo en lo referente a marcadores del discurso) y finalmente, la contemplación de dicho conocimiento a la luz de una perspectiva computacional. A continuación enumeramos brevemente los fundamentos teóricos del modelo de anotación:

  1. La visión del ser humano de la realidad es subjetiva. Los procesos de percepción de la realidad se podrían definir como una interacción constante entre lo que está fuera y lo que está dentro de nuestra mente. Así, la mente intenta buscar una coherencia entre los datos que percibe y el conocimiento del mundo que tiene ya almacenado. Los procesos mentales son una constante reelaboración de información al servicio de la expectativa, la decisión y la planificación de la acción futura. Según estas razones de orden biológico, la verdad de los enunciados depende de la fuente de conocimiento en la que se apoye, del grado de compromiso que el hablante quiera adquirir con ella, del tipo de inferencias en las que se ha basado el hablante, etc.
    1. Somos infodevoradores y la información que procesamos está regulada por el principio de relevancia: buscamos, de forma automática, mayores efectos contextuales con el menor coste de procesamiento.
    1. El proceso de comunicación lingüística es inferencial, y también está regido, como cualquier otro proceso cognitivo, por el principio de relevancia, el cual juega un papel discriminador durante el proceso de interpretación-codificación lingüística de los enunciados por parte del hablante y de descodificación del mensaje e interpretación del mismo por parte del interlocutor. (Sperber & Wilson 1995)
    1. A pesar de que los mensajes tienen un significado convencional, cuyo objeto de estudio pertenecería a la semántica, el significado último de un mensaje depende del contexto; de esta relación entre la interpretación y el uso del lenguaje en un contexto determinado se ocuparía la Pragmática.
    1. Desde una perspectiva computacional, esta última sentencia dejaría en punto muerto a la Inteligencia artificial y a toda iniciativa que se planteara la comprensión y generación de lenguaje en términos automáticos, ya que al final el significado último de un enunciado depende de la interpretación que haga la mente de un individuo. Sin embargo, desde las Ciencias Cognitivas (pero también desde otros marcos de posicionamiento, como el de Goffman (1959) desde la Sociología) se está insistiendo en la importancia de los marcos a la hora de guiar la conducta y las inferencias mentales del sujeto en una interacción. Desde una perspectiva computacional, una manera de salir de este cuello de botella consiste en introducir conocimiento del mundo en los ordenadores (una de las apuestas que una vertiente de la Inteligencia Artificial hace por el diseño de sistemas expertos); otra posibilidad, dentro de la Lingüística Computacional, sería la de comenzar a explicitar conocimiento semántico y pragmático en los corpus a través de su anotación. En

cualquiera de las dos soluciones, debemos formalizar esta interacción entre lo cognitivo, lo cultural, lo social y lo lingüístico.

  • En nuestro modelo de anotación proponemos, por tanto, un camino diferente al que tradicionalmente la Lingüística Computacional ha seguido en lo que a etiquetado de corpus se refiere: dicho camino ha partido de las categorías gramaticales para acabar en el nivel semántico, y es, en buena parte, responsable de los grandes problemas de desambiguación que al final lingüistas e informáticos deben afrontar. En Pragmatext se parte, por el contrario, de la idea de que un fenómeno de carácter universal, por tener una razón cognitiva, se codifica lingüísticamente a través de diferentes niveles de la gramática y se materializa en formas lingüísticas concretas que cumplen esta función. Así por ejemplo, la evidencialidad es un fenómeno a través del cual se expresa la fuente de conocimientos en la que se apoya la verdad de un enunciado. La evidencialidad es un fenómeno universal porque es inherente a nuestra percepción, ya que no podemos saberlo todo de primera mano. Este fenómeno se expresa de diferentes formas según la lengua de la que tratemos, por ejemplo, para algunas lenguas del este, hay ciertos morfemas responsables de especificar esta información (Jakobson 1957). En español, algunas estrategias no están lexicalizadas, otras sí, como por ejemplo, los marcadores discursivos por lo visto, relativamente, aparentemente, etc.2
  • Los fenómenos de naturaleza semántico-pragmática que se marcan en Pragmatext son los que se citan a continuación: expresión de las emociones, relaciones argumentativas, modalización lingüística, evidencialidad, actos de habla y deixis social y textual. Estos fenómenos han sido estudiados por la Pragmática Lingüística, la Cortesía Lingüística, la Lógica, la Lingüística Textual, la Lingüística Cognitiva, el Análisis Crítico del Discurso, y el Análisis de la Conversación; y muchos de ellos se codifican a través de los marcadores discursivos.

0.2.  Descripción del modelo

En este artículo vamos a aplicar este modelo con el fin de dar cuenta del significado de los marcadores discursivos encontrados en el corpus español, aunque, como ya hemos señalado, también estos fenómenos se expresan a través de otras estrategias gramaticales que derivan en otras formas lingüísticas. Por ejemplo, la atenuación discursiva también se puede expresar a través del uso de verbos modales conjugados en tiempo condicional: Me gustaría hacerle una pregunta. A continuación presentamos una tabla que ilustra esquemáticamente el modelo de anotación:

COGNICIÓN EN INTERACCIÓNPRAGMATICALINGUISTICA
EstrategiasFenómenosCategoríasCategoríasFormas lingüísticas
  ¿Cómo razonamos?Relaciones Argumentativ asCoargumentaciónConjunciones interjecciones Adverbios oracionalesademás, pero, porque, en primer lugar, y, aunque
Contraargumentación

2 Debemos a la Gramática Cognitiva esta visión de los fenómenos lingüísticos (Cuenca 1999).

  ConcesiónSintagmas Preposicionales Refranes   …
Reformulación …
  ¿Cómo modalizamos la percepción cuando interactuamos?    Modalización discursivaIntensificaciónseguramente, desde luego, claro
AtenuaciónBueno
Interacción¿eh? ¿no?¿sabes?
          ¿En qué fuentes apoyamos la verdad de nuestros enunciados?          Evidencialida dEl sentido de la vista de la persona 
Otros sentidosGeneralmente
Inferencia
  Otra persona
Por lo visto
Fuente escritaSegún la Biblia
Fuente oralQuien a hierro mata, a hierro muere
    ¿Cómo expresamos las emociones verbalmente?    Lenguaje de las emociones  EvaluaciónPositivaAfortunadamen te,
NegativaDesgraciadame nte
Otros: SorpresaAh, qué fuerte
        ¿Cómo conceptualizamos la percepción y cómo la convencionalizamos?          Metáfora    Dominio Origen : Cuerpo, Espacio, …ColocacionesTomar nota
LocucionesEchar de menos
      RefranesSarna con gusto no pica, pero mortifica
Dominio Meta: Tiempo, discurso, …a un tiro de piedra quien a hierro mata, a hierro muere
¿Cuáles son nuestras intenciones?Actos de habla3PeticionesOraciones con entonación interrogativaPuedes cerrar la puerta?
Demandas de información …A qué hora sale el tren?
¿Cómo nos referimos a otras partes del discurso y al interlocutor?DeixisTextualAdverbios …anteriormente
SocialVocativosPibe, tío, macho

3 La tipología de actos de habla se centra en los enunciados interrogativos para un corpus restringido a un contexto determinado, con el que luego se entrena un sistema de diálogo hombre-máquina.

Antes de explicar cómo cobra forma este esquema de anotación de marcadores discursivos en lenguaje XML, nos gustaría primero exponer algunos problemas teóricos y computacionales de los marcadores discursivos, ya que nuestra formalización también está orientada a dar cuenta de ellos en la medida de lo posible.

Add Comment

Your email address will not be published. Required fields are marked *

error: Este contenido está sometido a copyright.