It had always seemed to me that the linguistic system is inherently probabilistic in the grammar. M. A. K. Halliday.
Introducción
Parece que hay un acuerdo bastante general dentro de la comunidad científica que se dedica al estudio del significado de los marcadores discursivos a la hora de señalar que tanto la aparición de dichas palabras o multiwords como sus valores o usos están inextricablemente unidos a factores de carácter extralingüístico como por ejemplo el tipo de registro, la modalidad (oral o escrita) o la situación comunicativa (por ejemplo, una clase en un colegio), entre otros , , . Mª Martín Zorraquino señala también que la intersección entre marcadores discursivos y sociolingüística, es una de las asignaturas pendientes cuya laguna poco a poco se va sufragando.
Al mismo tiempo, parece también haber un acuerdo general a estas alturas del conocimiento de las lenguas en torno a la idea de que la perspectiva cuantitativa es necesaria para la descripción gramatical de las lenguas en tanto que constata la frecuencia de los fenómenos lingüísticos en función de las diferentes variables contextuales; especialmente en lo que respecta a la lengua oral, ya que como sabemos, debido a razones tanto tecnólogicas como idelógicas, hasta el día de hoy, sigue siendo bastante menos conocida que la variante escrita de las lenguas .
En lo que respecta a los marcadores del discurso, existen muy pocos estudios de corte cuantitativo en relación a los de naturaleza cualitativa. Es bastante posible que tanto la no-formalización de la información de los corpus como el desconocimiento de las herramientas computacionales para etiquetar corpus y extraer frecuencias automáticamente haya obligado a los lingüistas a sentirse más seguros en el terreno de la cualidad que en el de la cantidad a la hora de enunciar sus conclusiones sobre el significado de estas partículas en contextos restringidos. Aparte, debemos señalar que aquellos que se han atrevido a estudiar dichas partículas desde esta perspectiva obvian como si de información relevante no se tratara todo el proceso de gestión y extracción de la información, además de no explicitar debidamente las características de los corpus en los que han basado su estudio.
Por todas estas razones, hemos decidido que la primera aplicación del corpus C-ORAL-ROM anotado con los marcadores del discurso esté orientada a los lingüistas. En ella, exponemos los datos de las frecuencias de los marcadores discursivos del corpus en función de algunas variables contextuales como el género discursivo o el número de hablantes. Sirva esta tesis hasta este capítulo como un ejemplo de la metodología que se pudiera seguir para aquellos grupos de investigación dedicados a la Lingüística descriptiva que decidan etiquetar los marcadores discursivos de sus respectivos corpus con técnicas computacionales y con fines lingüísticos.
Add Comment