Estructura de consultas para la selección automática de formas gramaticales analíticas del tiempo futuro en lenguas eslavas
Resumen
Los corpus de textos actuales permiten a los investigadores llevar a cabo un amplio rango de análisis, así como automatizar la selección del material empírico gracias a una anotación detallada del texto. Ya que las anotaciones caracterizan mayoritariamente tales unidades como palabras, algunas categorías gramaticales expresadas por medio de formas analíticas no pueden ser anotadas aprovechando este enfoque, razón por la cual su selección se ve dificultada o produce resultados erróneos. Con el fin de resolver dicho problema proponemos utilizar consultas específicas mediante el lenguaje técnico CQL (Context Query Language) o similares, que puede compaginar todos los parámetros y condiciones que el investigador necesite: tanto lexemas con sus características como combinaciones enteras de ellos. Para ilustrar el uso, los resultados y potencialidades de dicha herramienta, describimos las particularidades destinadas a la selección de formas analíticas del tiempo futuro en 6 lenguas eslavas: bielorruso, checo, polaco, eslovaco, ruso y ucraniano. Las consultas CQL han de ser adaptadas para cada corpus modificando los nombres de las etiquetas, quedando invariable su estructura. Algunos corpus están provistos de una interfaz particular para la selección de dichas categorías. No obstante, el uso de CQL resulta ser una solución más universal puesto que incluye la posibilidad de modificar parcialmente las demandas más específicas del usuario, p. ej., selección de las formas futuras en una voz y aspecto determinados.
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Esta obra está bajo una licencia internacional de Reconocimiento-CompartirIgual 4.0 Internacional (CC BY-SA 4.0)
© Univesidad de Granada. Los originales publicados en las ediciones impresa y electrónica de esta Revista son propiedad de la Universidad de Granada, siendo necesario citar la procedencia en cualquier reproducción parcial o total.
1. Salvo indicación contraria, todos los contenidos de la edición electrónica se distribuyen bajo una licencia de uso y distribución “Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional" (CC BY-SA 4.0) ”. Puede consultar desde aquí la versión informativa y el texto legal de la licencia. Esta circunstancia ha de hacerse constar expresamente de esta forma cuando sea necesario.
2. Los autores pueden llegar a acuerdos contractuales por separado y adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (entre otros, a colgarlo en un depósito institucional o publicándola en un libro) con un reconocimiento de su publicación inicial en esta revista.
3. Los autores tienen permiso y se les anima a difundir su obra online (entre otros, en depósitos institucionales o en su propia página web) antes de y durante el proceso de envío, de manera que pueda llevar a intercambios productivos, así como a una temprana y mayor citación de la obra publicada (Véase The Effect of Open Access).