Contenido principal del artículo

Serhii Fokin
Universidad Nacional Taras Shevchenko de Kiev
Ucrania
Biografía
Núm. 19 (2020), Artículos, Páginas 25-38
Recibido: dic 15, 2020 Publicado: oct 30, 2020
Derechos de autor

Resumen

Los corpus de textos actuales permiten a los investigadores llevar a cabo un amplio rango de análisis, así como automatizar la selección del material empírico gracias a una anotación detallada del texto. Ya que las anotaciones caracterizan mayoritariamente tales unidades como palabras, algunas categorías gramaticales expresadas por medio de formas analíticas no pueden ser anotadas aprovechando este enfoque, razón por la cual su selección se ve dificultada o produce resultados erróneos. Con el fin de resolver dicho problema proponemos utilizar consultas específicas mediante el lenguaje técnico CQL (Context Query Language) o similares, que puede compaginar todos los parámetros y condiciones que el investigador necesite: tanto lexemas con sus características como combinaciones enteras de ellos. Para ilustrar el uso, los resultados y potencialidades de dicha herramienta, describimos las particularidades destinadas a la selección de formas analíticas del tiempo futuro en 6 lenguas eslavas: bielorruso, checo, polaco, eslovaco, ruso y ucraniano. Las consultas CQL han de ser adaptadas para cada corpus modificando los nombres de las etiquetas, quedando invariable su estructura. Algunos corpus están provistos de una interfaz particular para la selección de dichas categorías. No obstante, el uso de CQL resulta ser una solución más universal puesto que incluye la posibilidad de modificar parcialmente las demandas más específicas del usuario, p. ej., selección de las formas futuras en una voz y aspecto determinados.

 

Descargas

La descarga de datos todavía no está disponible.

Detalles del artículo