Pragmatext    y    los    marcadores    discursivos:    una    perspectiva    teórica    y computacional

En este trabajo hemos intentado trazar un puente de comunicación entre la Pragmática Lingüística y la Pragmática Computacional en lo que al tratamiento de los marcadores discursivos se refiere. Buena parte de este compromiso pasa por adoptar una postura coherente con respecto a los siguientes hechos:

  1. Inventario de marcadores discursivos: es momento de que la comunidad científica llegue a un acuerdo, por un lado, sobre qué es marcador discursivo y qué no, y por otro, sobre el número de marcadores discursivos existentes en una lengua así como de su distribución conversacional en términos diatópicos, diastráticos y diafásicos. Los corpus deben ayudarnos a esta tarea de recopilación.
  2. Ambigüedad categorial: muchas palabras que juegan un papel discursivo tienen a su vez otras funciones en el nivel oracional, como nombres, adjetivos, etc. Ejemplos de marcadores ambiguos categorialmente son, por ejemplo, bueno, entonces, primero, segundo, etc.
  3. Polifuncionalidad: Los marcadores discursivos están codificando información de diferentes clases (modal, ilocutiva, evidencial, deíctica, etc.) y algunos de ellos la expresan de forma simultánea. Además, marcadores como pues, bueno, como, etc. cumplen diferentes funciones discursivas en función de su posición y del tipo de discurso.
  4. Función discursiva y función oracional: También debemos llegar a un acuerdo sobre si etiquetar las ocurrencias la conjunción y (conjunción con un valor coargumentativo), solo cuando une oraciones, o si debemos etiquetarla también cuando une otro tipo de cláusulas como, por ejemplo, sintagmas nominales.
  5. Idiomaticidad: Necesitamos llegar a un acuerdo sobre cómo tratar la frecuente coaparición de más de un marcador discursivo en determinados contextos, tales como pero si, en oraciones del tipo Pero si yo no he sido, por ejemplo. Al tiempo que también debemos decidir si siguen siendo o no el mismo marcador claro y claro que; o sea y o sea que, etc.
  6. Localización automática en el texto: Debemos desarrollar instrumentos de desambiguación tanto categorial como discursiva que tengan una cobertura y una precisión aceptables en la anotación automática de corpus.

Por otro lado, desde la perspectiva computacional, necesitamos sistematizar y formalizar los marcadores discursivos para poder operar con ellos, al tiempo que debemos considerar las limitaciones del trabajo con textos sin contexto (como son los corpus no- multimodales, como este) y que después se deben procesar automáticamente. Si implementáramos, por ejemplo, todos los valores que del marcador discursivo bueno ha establecido la bibliografía, tendríamos un etiquetado muy rico, pero debería ir acompañado de un etiquetado de corpus a nivel de enunciado que distinguiera la misma información;

pero todavía no existen corpus etiquetados a este nivel. Así pues, debemos acercarnos a unas definiciones básicas que se mantengan constantes si no en todos al menos en la mayoría de los contextos de realización.

2.4 Etiquetado en XML

A continuación presentamos el modo en que hemos formalizado el significado de los marcadores discursivos en lenguaje XML.

Una de las primeras decisiones que debemos tomar es si esta información debe ser declarada a nivel de atributos o a nivel estructural (esto es, a nivel de elementos) y por qué. Nosotros hemos decidido dejar el nivel de elementos para explicitar la estructura externa de los textos de la ONU: párrafos, enunciados y unidades con información pragmática, en este caso, los marcadores discursivos; mientras que hemos reservado el nivel de los atributos para explicitar información sobre estas partículas de orden discursivo.

Sobre un marcador del discurso se explicitará la siguiente información: (1) Un identificador, (2) Los lemas que compongan el marcador discursivo, (3) Categoría gramatical originaria, (4) Un rasgo que explicite si es una unidad fraseológica o no, y el tipo: colocación o locución, (5) Posición en la que aparece dentro de la utterance o enunciado: inicial, media o final, (6) Si es operador o conector, (7) Si posee contenido metafórico y, en el caso de que así sea, los campos semánticos de origen y destino implicados, (8) Si contiene contenido emocional, y en el caso de que así sea si es negativo, positivo o de otra naturaleza (sorpresa, por ejemplo), (9) Si expresa una relación argumentativa: generalización, focalización, hipótesis, etc., (10) Si es atenuante, intensificador o interactivo, (11) Si contiene un acto de habla, y por último, (12) Si posee un valor deíctico textual o social. A continuación presentamos un ejemplo de cómo se etiquetan en XML estas unidades:

(1)

<PI ID=”1″ Lema1=”por” Lema2=”ejemplo” GC=”Prepositional_Phrase” DP=”2″ Range=”operator” FU=”Loc” MET=”No” DR=”Concretion” ED=”No” MOD=”No” EVI=”No” SA=”No” DEX=”No”>por ejemplo</PI>

En Pragmatext estos rasgos están separados y se pueden volver operativos o no, se pueden activar de una manera o de otra, dependiendo del marcador discursivo del que se trate. Esta es una de las ventajas del modelo de anotación, esto es, su flexibilidad a la hora de reflejar significados que remiten a fenómenos o dimensiones diferentes de la comunicación lingüística. . De esta manera, solucionamos a nivel teórico buena parte del problema de la ambigüedad de los marcadores discursivos, ya que cada uno de estos rasgos representa una dimensión de su posible contenido semántico.

Add Comment

Your email address will not be published. Required fields are marked *

error: Este contenido está sometido a copyright.