Resumen y novedad del trabajo

Comencemos con un breve resumen de la investigación que se ha llevado a cabo en esta tesis. En primer lugar, nos gustaría destacar que este trabajo se ha ocupado fundamentalmente del problema de cómo gestionar los marcadores discursivos en un corpus concreto, C-Oral-Rom, en todas y cada una de sus etapas, desde la más puramente teórica hasta su aplicación a otras parcelas de conocimiento, pasando por el imprescindible trabajo computacional que es necesario hacer cuando se debe gestionar una cantidad importante de datos. Para ello, hemos atendido a los marcos teóricos más sobresalientes de esta disciplina, hemos visto qué resultados han dado la aplicación de esos enfoques al estudio del significado de los marcadores del discurso, y con esta información hemos diseñado un esquema de anotación basados en rasgos pragmáticos. Este modelo de anotación está destinado al etiquetado de partículas que hacen referencia a procesos de la enunciación del discurso, a los valores de verdad de los enunciados y al modo en que los enunciados empiezan a influirse unos a otros en términos de valores de verdad. Como se puede observar, este tipo de información, como por ejemplo, palabras que codifiquen atenuación, no tienen nada que ver con la información que la Lingüística de Corpus nos ha ofrecido hasta el momento de los textos, como la información que nos habla de las categorías gramaticales de las palabras, las que diferencian eventos y sus argumentos, o las que explicitan funciones sintácticas. Estamos dando cuenta aquí de un nivel de la lengua, propio de la enunciación, que si bien no soluciona el problema del significado de los enunciados y la relación entre ellos, sí se considera un paso necesario a la hora de plantearse la resolución computacional de este problema. Más concretamente, Pragmatext, nuestros modelo de anotación, trata de la presencia de los siguientes fenómenos lingüísticos: emociones, deixis, certeza, evidencialidad, metáfora, convencionalización y operaciones del discurso. Cada fenómeno ocupa un rasgo y aporta un valor sobre el significado final del enunciado. Además, el hecho de colocarlos como valores separados da la posibilidad de reflejar la influencia que tienen unos rasgos sobre otros de una manera discreta. Una vez que hemos diseñado el esquema de anotación, hemos desarrollado estrategias para introducir dicha información en los textos de la manera más automática posible. Para lo cual hemos diseñado el etiquetador de marcadores discursivos, DiMaSTagger. Una vez que todos los marcadores del discurso tienen en los textos su etiqueta correspondiente hemos presentado dos aplicaciones en los que este nivel de anotación puede ser útil a la hora de recuperar información lingüística en los textos. La primera de ellas ha sido en el terreno de la Lingüística Cuantitativa, donde hemos analizado la frecuencia de los diferentes marcadores en relación a los géneros discursivos. En la segunda, hemos realizado una interfaz Web para que el estudiante ELE pueda educar, por medio de los contenidos presentados, su sensibilidad hacia la dimensión pragmática de la lengua a través del estudio de los marcadores del discurso del español oral. Finalmente, en la última parte, denominada De la interpretación hemos reflexionado sobre la relación entre Pragmática, Lingüística Computacional e Inteligencia Artificial, haciendo hincapié en los desafíos que representa para estas disciplinas la implementación de este conocimiento.
Así pues, para resumir las novedades de la tesis, hemos intentado contribuir a diferentes parcelas de conocimiento intentando salvar las carencias que dichas parcelas presentan en algunos aspectos. A nivel teórico-descriptivo, dentro de la Pragmática Lingüística, esperamos haber contribuido con este estudio a la recolección y sistematización de esta clase de palabras. En lo que respecta a la Lingüística de Corpus, hemos diseñado un modelo de anotación pragmática que intenta recoger con amplitud los fenómenos de los cuales esta parcela se ha ocupado e intentado salvar la carencia de modelos de anotación en este nivel que encontramos en este terreno de investigación. En lo que respecta a la parte computacional, no encontramos etiquetadores de marcadores que reconozcan y clasifiquen estas partículas en lengua española. En penúltimo lugar, dentro de las aplicaciones, esperamos haber abierto una veta en la Lingüística Cuantitativa de los estudios en lengua española de carácter empírico, en lo que se refiere a la aplicación de las técnicas de la Lingüística Computacional al estudios de la frecuencia de los marcadores del discurso en función del género discursivo. Finalmente, en la parte dedicada a la generación automática de lenguaje natural, disciplina que entraría dentro de la Inteligencia Artificial, esperamos haber contribuido a nivel teórico con nuestras reflexiones sobre el lugar que la Pragmática debería ocupar dentro de este campo.
Establecidos pues los puntos novedosos de la tesis, pasemos a explicar aquellos puntos susceptibles de crítica y de mejora en investigaciones futuras.

Resumen y novedad del trabajo

Comencemos con un breve resumen de la investigación que se ha llevado a cabo en esta tesis. En primer lugar, nos gustaría destacar que este trabajo se ha ocupado fundamentalmente del problema de cómo gestionar los marcadores discursivos en un corpus concreto, C-Oral-Rom, en todas y cada una de sus etapas, desde la más puramente teórica hasta su aplicación a otras parcelas de conocimiento, pasando por el imprescindible trabajo computacional que es necesario hacer cuando se debe gestionar una cantidad importante de datos. Para ello, hemos atendido a los marcos teóricos más sobresalientes de esta disciplina, hemos visto qué resultados han dado la aplicación de esos enfoques al estudio del significado de los marcadores del discurso, y con esta información hemos diseñado un esquema de anotación basados en rasgos pragmáticos. Este modelo de anotación está destinado al etiquetado de partículas que hacen referencia a procesos de la enunciación del discurso, a los valores de verdad de los enunciados y al modo en que los enunciados empiezan a influirse unos a otros en términos de valores de verdad. Como se puede observar, este tipo de información, como por ejemplo, palabras que codifiquen atenuación, no tienen nada que ver con la información que la Lingüística de Corpus nos ha ofrecido hasta el momento de los textos, como la información que nos habla de las categorías gramaticales de las palabras, las que diferencian eventos y sus argumentos, o las que explicitan funciones sintácticas. Estamos dando cuenta aquí de un nivel de la lengua, propio de la enunciación, que si bien no soluciona el problema del significado de los enunciados y la relación entre ellos, sí se considera un paso necesario a la hora de plantearse la resolución computacional de este problema. Más concretamente, Pragmatext, nuestros modelo de anotación, trata de la presencia de los siguientes fenómenos lingüísticos: emociones, deixis, certeza, evidencialidad, metáfora, convencionalización y operaciones del discurso. Cada fenómeno ocupa un rasgo y aporta un valor sobre el significado final del enunciado. Además, el hecho de colocarlos como valores separados da la posibilidad de reflejar la influencia que tienen unos rasgos sobre otros de una manera discreta. Una vez que hemos diseñado el esquema de anotación, hemos desarrollado estrategias para introducir dicha información en los textos de la manera más automática posible. Para lo cual hemos diseñado el etiquetador de marcadores discursivos, DiMaSTagger. Una vez que todos los marcadores del discurso tienen en los textos su etiqueta correspondiente hemos presentado dos aplicaciones en los que este nivel de anotación puede ser útil a la hora de recuperar información lingüística en los textos. La primera de ellas ha sido en el terreno de la Lingüística Cuantitativa, donde hemos analizado la frecuencia de los diferentes marcadores en relación a los géneros discursivos. En la segunda, hemos realizado una interfaz Web para que el estudiante ELE pueda educar, por medio de los contenidos presentados, su sensibilidad hacia la dimensión pragmática de la lengua a través del estudio de los marcadores del discurso del español oral. Finalmente, en la última parte, denominada De la interpretación hemos reflexionado sobre la relación entre Pragmática, Lingüística Computacional e Inteligencia Artificial, haciendo hincapié en los desafíos que representa para estas disciplinas la implementación de este conocimiento.
Así pues, para resumir las novedades de la tesis, hemos intentado contribuir a diferentes parcelas de conocimiento intentando salvar las carencias que dichas parcelas presentan en algunos aspectos. A nivel teórico-descriptivo, dentro de la Pragmática Lingüística, esperamos haber contribuido con este estudio a la recolección y sistematización de esta clase de palabras. En lo que respecta a la Lingüística de Corpus, hemos diseñado un modelo de anotación pragmática que intenta recoger con amplitud los fenómenos de los cuales esta parcela se ha ocupado e intentado salvar la carencia de modelos de anotación en este nivel que encontramos en este terreno de investigación. En lo que respecta a la parte computacional, no encontramos etiquetadores de marcadores que reconozcan y clasifiquen estas partículas en lengua española. En penúltimo lugar, dentro de las aplicaciones, esperamos haber abierto una veta en la Lingüística Cuantitativa de los estudios en lengua española de carácter empírico, en lo que se refiere a la aplicación de las técnicas de la Lingüística Computacional al estudios de la frecuencia de los marcadores del discurso en función del género discursivo. Finalmente, en la parte dedicada a la generación automática de lenguaje natural, disciplina que entraría dentro de la Inteligencia Artificial, esperamos haber contribuido a nivel teórico con nuestras reflexiones sobre el lugar que la Pragmática debería ocupar dentro de este campo.
Establecidos pues los puntos novedosos de la tesis, pasemos a explicar aquellos puntos susceptibles de crítica y de mejora en investigaciones futuras.

Add Comment

Your email address will not be published. Required fields are marked *

error: Este contenido está sometido a copyright.