Lenguas sudamericanas en bases de datos tipológicas: un estado del arte

Línea de investigación:

Lingüística computacional, bases de datos y tecnologías del lenguaje

Descripción

Las lenguas sudamericanas son fundamentales para la tipología lingüística. La cobertura de datos de estos idiomas varía significativamente entre las diversas bases de datos tipológicas disponibles. Hay lenguas, linajes lingüísticos y características tipológicas de América del Sur que están subrepresentadas en la investigación tipológica. Actualmente, Grambank exhibe hojas de datos para 253 idiomas sudamericanos. Se codificó un promedio de 160,98 rasgos por idioma, y​​para cada rasgo en la base de datos de Grambank, se dispone de información para un promedio de 183,49 ± 38,35 idiomas sudamericanos. Desafortunadamente, estimaciones similares para otras bases de datos como WALS (https://wals.info/) y SAILS (https://sails.clld.org/) no están disponibles. En este proyecto, intentamos estudiar de manera sistemática y experimental la cobertura de las lenguas sudamericanas en las bases de datos tipológicas más importantes como un primer paso para determinar qué preguntas se pueden hacer con base en los datos disponibles, y cuáles son los mejores enfoques y/o o métodos para responderlas. Financiado por el Instituto Max Planck para la Antropología Evolutiva. Líneas de investigación: Lingüística computacional, bases de datos y tecnologías del lenguaje

No items found.