Este apartado está dedicado a explicar el formato de la transcripción de C-ORAL-ROM etiquetado en XML con Pragmatext. En el capítulo cinco ya hemos adelantado el modo en que aparecen etiquetadas las unidades de información pragmática en XML. Aquí damos una explicación global al texto de la transcripción.
Como ya sabemos, la información pragmática se ha colocado a nivel de atributos. De lo contrario, esto es, si hubiéramos decidido declarar los fenómenos pragmáticos a nivel estructural, hubiéramos tenido que predecir su coaparición, y esto hubiera complicado bastante el esquema. Por ejemplo, ¿qué hubiéramos puesto antes? ¿un acto de habla o una operación argumentativa? Además, esta información a veces se cruza entre sí: por ejemplo, una unidad fraseológica puede ser un marcador discursivo pero no todos las unidades fraseológicas son marcadores discursivos, ni todos los marcadores discursivos son unidades fraseológicas. Es por eso que hemos preferido dejar la parte de los elementos para la estructura del texto y la de los atributos, como decimos, para reflejar la información pragmática en rasgos sin jerarquizar, todos al mismo nivel. Además, en el caso de que en el futuro se decida reflejar otro tipo de información, este modelo nos permite añadir libremente más fenómenos de naturaleza pragmática sin tener que hacer grandes cambios en la DTD.
A nivel de elementos, nuestra formalización a XML respeta el formato CORALROM XML 1. Usando las mismas etiquetas en XML que codificaron los textos vírgenes de la transcripción, hemos diferenciado cabecera y texto, y dentro de este, las intervenciones de los participantes junto con los comentarios o anotaciones. Cada intervención está compuesta por enunciados que tienen los atributos de ser interrogativos, aseverativos, interrumpidos, suspendidos o incompletos 2. Cuando haya un marcador del discurso dentro de una intervención se le introducirá su correspondiente etiqueta.
A continuación presentamos un organigrama sobre la macroestructura de los textos, y seguidamente un ejemplo de transcripción etiquetada con el modelo de anotación Pragmatext.
] Comentarios ] ] ]
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE Transcription SYSTEM "coralromMD.dtd">
<Transcription>
<Header>
<Title> problemas de novios </Title>
<File> efamcv10 </File>
<Participants>
<Speaker>
<ShortName> ELE </ShortName>
<FullName> Elena </FullName>
<Sex Type="woman" />
<Age Type="B" />
<Education Type="3" />
<Occupation> student </Occupation>
<Role> participant </Role>
<Origin> Madrid </Origin>
</Speaker>
<Speaker>
<ShortName> ANT </ShortName>
<FullName> Antonio </FullName>
<Sex Type="man" />
<Age Type="B" />
<Education Type="3" />
<Occupation> student </Occupation>
<Role> participant </Role>
<Origin> Madrid </Origin>
</Speaker>
<Speaker>
<ShortName> ANA </ShortName>
<FullName> Ana </FullName>
<Sex Type="woman" />
<Age Type="B" />
<Education Type="3" />
<Occupation> student </Occupation>
<Role> participant </Role>
<Origin> Madrid </Origin>
</Speaker>
<Speaker>
<ShortName> SEV </ShortName>
<FullName> Ana </FullName>
<Sex Type="woman" />
<Age Type="B" />
<Education Type="3" />
<Occupation> student </Occupation>
<Role> participant </Role>
<Origin> Sevilla </Origin>
</Speaker>
</Participants>
<Date> 03/04/2001 </Date>
<Place> Madrid </Place>
<Situation> chat between friends at university, hidden,
researcher participant </Situation>
<Topic> friends and lovers </Topic>
<Source> C-ORAL-ROM </Source>
<Class Type1="informal" Type2="family_private" Type3="conversation" />
<Length> 6' 24'' </Length>
<Words> 1568 </Words>
<Acoustic_quality Type="A" />
<Transcribers>
<Transcriber> Manuel </Transcriber>
</Transcribers>
<Revisors>
<Revisor> Guillermo </Revisor>
<Revisor> Manuel and Jesús (prosody) </Revisor>
</Revisors>
<Comments> </Comments>
</Header>
<Text>
<f h="ELE" file="efamcv10">
<sf tipo="enunciation"> yo le entendía perfectamente </sf>
<sf tipo="suspension"> <DM grupo="2" tipo="2.2" FU="No"
MET="No" SD="No" TD="No" DR="Coargumentation2" ED="No"
MOD="No" EVI="No" SA="No" DEX="No">y</DM> lo
<CAT grupo="0" tipo="0">que</CAT> no le quería decir era
/ decirle / <DM grupo="2" tipo="1.5" FU="No" MET="No"
SD="No" TD="No" DR="No" ED="No" MOD="Interaction"
EVI="No" SA="No" DEX="Social_Interlocutor">mira</DM>
/ Fran / <DM grupo="1" FU="Loc" MET="No" SD="No"
TD="No" DR="Reformulation" ED="No" MOD="No" EVI="No"
SA="No" DEX="No">o sea</DM> / yo no estoy enamorada de ti
/ <DM grupo="1" FU="No" MET="No" SD="No" TD="No"
DR="Consequence" ED="No" MOD="No" EVI="No"
SA="No" DEX="No">entonces</DM> no lo voy a </sf>
</f>
<f h="ANA" file="efamcv10">
<sf tipo="enunciation"> <DM grupo="2" tipo="1.5"
FU="No" MET="Sí" SD="Light" TD="Evidence" DR="No"
ED="No" MOD="Truth_Booster" EVI="No" SA="No"
DEX="No">claro</DM> </sf>
</f>
<f h="ELE" file="efamcv10">
<sf tipo="enunciation"> no le quería decir
<DM grupo="2" tipo="3.4" FU="No" MET="No" SD="No"
TD="No" DR="No" ED="No" MOD="Truth_Booster" EVI="No"
SA="No" DEX="Social_Interlocutor">eso</DM> </sf>
<sf tipo="interruption"> <DM grupo="1" FU="No" MET="No"
SD="No" TD="No" DR="Consequence" ED="No" MOD="No" EVI="No"
SA="No" DEX="No">entonces</DM> no [/] no [/] no </sf>
<sf tipo="enunciation"> <DM grupo="1" FU="No" MET="No"
SD="No" TD="No" DR="No" ED="Surprise" MOD="No" EVI="No"
SA="No" DEX="No">¡ah!</DM> / <DM grupo="1" FU="No" MET="No"
SD="No" TD="No" DR="Cause" ED="No" MOD="No" EVI="No" SA="No"
DEX="No">porque</DM> <DM grupo="1" FU="No" MET="No" SD="No"
TD="No" DR="Coargumentation2" ED="No" MOD="No" EVI="No"
SA="No" DEX="No">además</DM> <DM grupo="2" tipo="3.1"
FU="Loc" MET="Sí" SD="Existence" TD="Explanation"
DR="Explanation" ED="No" MOD="No" EVI="No" SA="Justification"
DEX="No">es que</DM> <DM grupo="1" FU="No" MET="No"
SD="No" TD="No" DR="Coargumentation2" ED="No" MOD="No"
EVI="No" SA="No" DEX="No">tampoco</DM>
sabía <CAT grupo="0" tipo="0">muy bien</CAT> lo <CAT grupo="0"
tipo="0">que</CAT>le quería decir </sf>
<sf tipo="interruption"> <DM grupo="1" FU="No" MET="No"
SD="No" TD="No" DR="Consequence" ED="No" MOD="No"
EVI="No" SA="No" DEX="No">entonces</DM> / a mí me pa </sf>
<sf tipo="continuation"> <DM grupo="1" FU="Col" MET="No"
SD="No" TD="No" DR="No" ED="No" MOD="Interaction" EVI="No" SA="No"
DEX="Social_Interlocutor">qué pasa ?</DM> </sf>
</f>
<f h="ANT" file="efamcv10">
<sf tipo="enunciation"> hhh / <DM grupo="2" tipo="1.5"
FU="No" MET="No" SD="No" TD="No"
DR="Indefinite_Transitional_End" ED="No" MOD="Formulation_Hedge" EVI="No"
SA="No" DEX="No">nada</DM> </sf>
<Notes Type="act"> (1) laugh </Notes>
</f>
<f h="ELE" file="efamcv10">
<sf tipo="suspension"> <DM grupo="1" FU="No"
MET="No" SD="No" TD="No" DR="No" ED="Surprise"
MOD="No" EVI="No" SA="No" DEX="No">¡ah!</DM> /
<DM grupo="1" FU="No" MET="No" SD="No" TD="No"
DR="Consequence" ED="No" MOD="No" EVI="No"
SA="No" DEX="No">entonces</DM>
yo lo <CAT grupo="0" tipo="0">que</CAT>
hhh quería </sf> <Notes Type="act"> (6) laugh </Notes>
</f>
<f h="ANA" file="efamcv10">
<sf tipo="enunciation"> hhh </sf>
<Notes Type="act"> (1) laugh </Notes>
</f>
</Text>
</Transcription>
Aquí termina el capítulo seis. A continuación, en el siguiente capítulo profundizaremos en el reconocimiento, desambiguación y etiquetado automático de las unidades de información pragmática.
Add Comment