Tamaño de fuente:
Investigando polisemia con corpus: límites y oportunidades
Última modificación: 2023-09-05
Resumen
En este capítulo extraemos información distribucional de un corpus para representar las ocurrencias de distintos ítems léxicos, de forma tal que ocurrencias similares aparecen juntas en una nube de puntos. Por ejemplo, el verbo neerlandés huldigen puede significar ‘rendir homenaje’ o ‘sostener (una opinión)’ dependiendo del objeto directo. La pregunta es: ¿podemos extraer información de un corpus de forma tal que, automáticamente, obtengamos grupos separados de ocurrencias que corresponden a los distintos sentidos de un ítem polisémico? De no ser así, ¿qué información sí puede ser extraída de un corpus, y cómo nos puede ayudar en descripciones semánticas? Ilustrando uno de 32 términos en neerlandés estudiados, mostraremos cómo estos métodos logran capturar patrones colocacionales, pero la medida en que estos caracterizan un sentido en términos definicionales depende del comportamiento distribucional específico de cada palabra.
Palabras clave
lexicología; lingüística de corpus; neerlandés; semántica distribucional
Texto completo:
PDF