Investigando polisemia con corpus: límites y oportunidades

Mariana Montes

Eventos Académicos, XI Simposio de la Asociación Argentina de Lingüística Cognitiva

Mariana Montes

Última modificación: 2023-09-05

Resumen

En este capítulo extraemos información distribucional de un corpus para representar las ocurrencias de distintos ítems léxicos, de forma tal que ocurrencias similares aparecen juntas en una nube de puntos. Por ejemplo, el verbo neerlandés huldigen puede significar ‘rendir homenaje’ o ‘sostener (una opinión)’ dependiendo del objeto directo. La pregunta es: ¿podemos extraer información de un corpus de forma tal que, automáticamente, obtengamos grupos separados de ocurrencias que corresponden a los distintos sentidos de un ítem polisémico? De no ser así, ¿qué información sí puede ser extraída de un corpus, y cómo nos puede ayudar en descripciones semánticas? Ilustrando uno de 32 términos en neerlandés estudiados, mostraremos cómo estos métodos logran capturar patrones colocacionales, pero la medida en que estos caracterizan un sentido en términos definicionales depende del comportamiento distribucional específico de cada palabra.

Palabras clave

lexicología; lingüística de corpus; neerlandés; semántica distribucional

Texto completo: PDF