Inter Alia para lingüistas
Inter Alia para lingüistas

Si el usuario quiere entrar al cuenta frecuencias en función del género discursivo de la aplicación debe pulsar la segunda opción de la página Web, después introducirá el marcador que desee analizar y a continuación aparecerán los datos sobre su frecuencia en el corpus. Ejemplos de estos tres pasos son las imágenes presentadas abajo:

Read more
Conclusiones al capítulo 7
Conclusiones al capítulo 7

En este punto del trabajo, hemos resuelto el núcleo duro de la investigación. Hemos diseñado un modelo de anotación que ya está reflejado en los textos del corpus, el cual en este momento de la investigación ya está codificado en formato XML. Ahora ya solo queda saber qué cosas se pueden hacer con el corpus.

Read more
Resultados del grado de acierto sobre CAT vs. MD
Resultados del grado de acierto sobre CAT vs. MD

Veamos a continuación los datos de ocurrencias de formas lingüísticas que en el corpus se usan o bien como marcadores o bien como otra categoría. Estos datos también se tendrán en cuenta a la hora de hacer reglas de desambiguación particulares para cada marcador. MD BIEN MAL bueno 1242 50 es que 1056 74 claro

Read more
Funcionamiento a tiempo real de DiMaSTagger
Funcionamiento a tiempo real de DiMaSTagger

Hemos hablado hasta aquí de un programa concebido en módulos que se combinan entre sí para dar cuenta de las especificidades de cada grupo de marcadores. Expliquemos ahora, también brevemente, cuál es la dinámica general del anotador.El anotador anota texto por texto los marcadores de los cuatro grupos. De nuevo este planteamiento nos ha parecido

Read more
Módulos de etiquetación
Módulos de etiquetación

El módulo difícil de etiquetación afecta a aquellos grupos que tengan más de una etiqueta. En este caso, es imposible con la información de la que partimos saber cuándo una palabra como hombre (cuando es MD y no nombre) es un atenuante o bien es un codificador de la sorpresa. Es por eso que para ello debemos

Read more
Fase de anotación
Fase de anotación

El anotador automático DiMaSTagger está dividido en dos partes: un reconocedor y un etiquetador. El reconocedor busca, identifica candidatos a marcador discursivo en los textos; mientras que el etiquetador introduce la etiqueta en Xml correspondiente dentro del texto, una vez que el reconocedor ya ha hecho su trabajo.Como ya hemos señalado anteriormente, hay cuatro tipos

Read more
Reconocimiento de los candidatos a MD en el corpus
Reconocimiento de los candidatos a MD en el corpus

Tenemos que tener en cuenta que esta lista que hemos elaborado en realidad no es una lista de marcadores del discurso sino que es una lista de palabras que son candidatas posibles a que en el corpus sean realmente marcador discursivo. Así por ejemplo, algunas palabras de la lista no estarán, otras estarán pero posiblemente

Read more
error: Este contenido está sometido a copyright.