Etiquetado en XML

A continuación, vamos a glosar más detenidamente la formalización del modelo de anotación en formato XML; información que se adelantó en el capítulo anterior con el fin de que el lector observara la transición desde la concepción teórica hasta su anotación formal.
Sobre un marcador del discurso se explicitará la siguiente información:

  1. Un rasgo que señale si es una unidad fraseológica o no, y el tipo: colocación, locución o enunciado, en el caso de los refranes.
  2. Nivel de ambigüedad.
  3. Si posee contenido metafórico y, en el caso de que así sea, especificar los campos semánticos de origen y destino implicados.
  4. Si contiene contenido emocional, y en el caso de que así sea si es negativo, positivo o de otra naturaleza (sorpresa, por ejemplo).
  5. Si expresa una relación argumentativa: generalización, focalización, hipótesis, etc.
  6. Si es atenuante, intensificador o interactivo.
  7. Si contiene un acto de habla y especificar cuál.
  8. Si posee un valor deíctico, que puede ser textual: anteriormente, por ejemplo, en el caso del marcador anteriormente en Anteriormente os comenté que ayer no hice nada; o puede ser social (pibe, piba, tío, tía, chaval, hombre, mujer, etc.)

A pesar de que también se ha mencionado en el capítulo anterior, me gustaría que el lector me permitiera insistir de nuevo en las bondades de un modelo basado en rasgos para el nivel pragmático. En Pragmatext, estos rasgos están separados y se pueden volver operativos o no, se pueden activar de una manera o de otra, dependiendo del marcador discursivo de que se trate. Esta es una de las ventajas del modelo de anotación, esto es, su flexibilidad a la hora de reflejar significados que remiten a fenómenos o dimensiones diferentes de la comunicación lingüística. Este sistema de rasgos semántico-pragmáticos nos permite reflejar diferente tipo de información de forma simultánea. De esta forma solucionamos a nivel teórico buena parte del problema de la ambigüedad de los marcadores discursivos, ya que cada uno de estos rasgos representa una dimensión de su posible contenido. Así por ejemplo, podemos dar cuenta de la interacción entre modalidad y evidencialidad, o de la modalidad y actos de habla, sin necesidad de crear una etiqueta o un tipo de marcador discursivo nuevo, o de crear un nuevo valor o una nueva función textual. También nos permite establecer paralelismos y contrastes sutiles entre marcadores discursivos de una misma familia. Por ejemplo, la diferencia entre qué bien y menos mal, es que ambas expresiones, que son emocionales, expresan un juicio positivo de la realidad, sin embargo, qué bien tiene un rasgo de intensificación que en menos mal no está. Otro ejemplo. El marcador discursivo gracias a tendrá el rasgo de relación causal activado así como el de evaluación positiva, ya que en este marcador, la causa se presenta con rasgo emocional positivo por parte del hablante.
A continuación, podemos ver un ejemplo de cómo queda formalizado este modelo de anotación en lenguaje XML.

<PI Grupo="1" Regla="2.8" FU="Loc" MET="No" DR="Concretness" 
ED="No" MOD="No" EVI="No"SA="No" DEX="No">por ejemplo</PI> 
DMDiscourse Marker
FUFraseological Unit
METMetaphore
DRDiscourse Relation
EDEmotional Discourse
MODModality
EVIEvidentiality
SASpeech Act
DEXDeixis
GrupoNivel de ambigüedad
TipoPosición contextual
FUCol, Loc, Proverb, No
METSí, No
SDArray, Orientation, Levels-of-Space, Possibilitys, Weight, Calculations, Food, Family, Human-Body, Human-Being, Mithology, Agreement, Religion, End, Existence, Sight, Action, Perception, Nature, Physiological-Activity, Movement, Hell, Milk, Levels-of-Reality, Levels-of-Deep, Body, Space, Light, Time, Attention, Calcule, Quantity, Goodness
TDFuture, Narration, The-Truth, Meaning, Ways, Opinion, Knowledge, Discourse, Argumentation, Summary, Action, Hedge, Emotion, Rejection, Intensity, Sight, Perception, Concessiveness, Demonstration, Quantity, Deduction, Agree, Surprise, Time, Apologize, Explanation, Complaint, Goodness, Negative-Evaluation, Positive-Evaluation, Levels-of-Truth, Enunciation, Evidentiality, Sincerity, Discourse-Argumentation, Interaction, Warning, Evidence, No
DRDefinite End, Cataphoric Cause, Discourse Production, Contraargumentation, Digression, Coargumentation1, Indefinite Transitional End, Coargumentation2, Coargumentation3, Reformulation, Hypothesis, Option, Conclusion Summary, Cause, Consequence, Anaphoric Concessiveness Cataphoric Conclusion, Framework, Generalization, Concretness, Anaphoric Cause Cataphoric Consequence, Scalar Meaning, No
EDPositive-Evaluation, Negative-Evaluation, Surprise, No
MODDR-Hedge, DR-Booster, Interactional-Hedge, Acte-Hedge, Formulation-Hedge, Truth-Booster, Truth-Hedge, Hedge-Action, Surprise-Booster, Surprise-Hedge, Acte-Booster, Emotion-Booster, Emotion-Hedge, Interaction
EVIInference, Cultural-Knowledge, Indirect-Discourse, Inference-First-Person, First-Person, Others, Sight-First-Person, Other-Senses, Others-Persons, No
SACommitment, Wish, Rejection, Acceptation, Ask, Assertion, Compliment, Assent, Reciprocal-Action, Interaction-Close, Risk, Justification, Complaint, Resignation, Greeting-Open, Refuse, Greeting-Close, Gratitude, Action, Warning, Apologize
DEXContextual, Social-Interlocutor, Textual-Contextual
Grupo1, 2, 3
Tiponº de regla de desambiguación contextual

Esta es la información que le podemos preguntar a los textos de C-Oral-Rom sobre el marcador discursivo por ejemplo. Del cual se ha explicitado que es una locución (UF=No), que no contiene contenido metafórico (MET=No), que codifica una operación discursiva de concreción (DR=Concretness), que no tiene un contenido emocional (ED=No), que no contiene modalidad (MOD=No), que no marca una fuente de conocimiento (EVI=No), que no alude a un acto de habla (SA=No), ni indica a ningún espacio del texto, ni a ninguna persona (DEX=No), que tiene un nivel de ambigüedad 1 y que su regla contextual es 2.8 1. En las tablas 5.1 y y 5.2 se recogen todas las etiquetas de nuestro modelo de anotación.
Por razones de espacio, no se comentan aquí las razones por las que hemos decidido que cada uno de los 621 marcadores que contiene nuestro lexicón ha sido etiquetado en la manera en que aparecen en las tablas. Esta parte de la información se podrá consultar en el interfaz Web, donde aparecerá un link para cada marcador, y de cada uno se podrá obtener una justificación de por qué se ha etiquetado así en el caso de que esta decisión no sea compartida por la tradición bibliográfica; también se podrá acceder a ejemplos del corpus en los que aparezca dicho marcador, y podremos ver de nuevo su o sus etiquetas, en el caso de que tenga más de un significado. Adelantamos que hay partículas como como u hombre cuya clasificación requiere un comentario extenso, y por ello remitimos al lector al interfaz, y en cambio otras como afortunadamente o como consecuencia que son bastantes intuitivas y no requieren comentario. Pasemos pues a mostrar las tablas de clasificación.

Add Comment

Your email address will not be published. Required fields are marked *

error: Este contenido está sometido a copyright.