Структура запросов для автоматического выбора аналитических грамматических форм будущего времени в славянских языках
Аннотация
Современные корпусные инструменты позволяют лингвистам выполнять широкий спектр и тип анализа, а также автоматизировать отбор эмпирического материала благодаря подробному аннотированию текстов. Поскольку аннотация в основном ориентирована на слова, некоторые грамматические категории, которые выражаются с помощью аналитических форм, не могут быть помечены как таковые при словоориентированном подходе, из-за чего во многих корпусах их выбор затруднен или приводит к ошибочным результатам. Чтобы преодолеть эту проблему, мы предлагаем использовать специальные запросы на языке контекстных запросов (CQL), которые могут объединять столько параметров и условий, сколько может потребоваться указать исследователю: лексемы с их характеристиками или их последовательность. Чтобы проиллюстрировать использование, возможные результаты и потенциал этого инструмента, мы делаем обзор запросов, направленных на выбор аналитических форм будущего на 6 славянских языках: белорусском, немецком, польском, словацком, русском и украинском. CQL-запросы должны быть адаптированы для каждого корпуса путем изменения имени тега, хотя структура запроса остается идентичной. Некоторые аннотированные корпуса не принимают CQL-запрос, хотя они предоставляют специальный пользовательский интерфейс для выбора грамматических категорий. Тем не менее, CQL представляется более универсальным решением (хотя и более сложным в использовании), поскольку оно включает в себя возможность частичного изменения параметров поиска, например, выбора будущих форм в определенном тоне или аспекте.
Скачивания
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Esta obra está bajo una licencia internacional de Reconocimiento-CompartirIgual 4.0 Internacional (CC BY-SA 4.0)
© Univesidad de Granada. Los originales publicados en las ediciones impresa y electrónica de esta Revista son propiedad de la Universidad de Granada, siendo necesario citar la procedencia en cualquier reproducción parcial o total.
1. Salvo indicación contraria, todos los contenidos de la edición electrónica se distribuyen bajo una licencia de uso y distribución “Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional" (CC BY-SA 4.0) ”. Puede consultar desde aquí la versión informativa y el texto legal de la licencia. Esta circunstancia ha de hacerse constar expresamente de esta forma cuando sea necesario.
2. Los autores pueden llegar a acuerdos contractuales por separado y adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (entre otros, a colgarlo en un depósito institucional o publicándola en un libro) con un reconocimiento de su publicación inicial en esta revista.
3. Los autores tienen permiso y se les anima a difundir su obra online (entre otros, en depósitos institucionales o en su propia página web) antes de y durante el proceso de envío, de manera que pueda llevar a intercambios productivos, así como a una temprana y mayor citación de la obra publicada (Véase The Effect of Open Access).