Богуславский И.М., Иомдин Л.Л., Валеев Д.Р., Сизов В.Г.
Синтаксический анализатор системы ЭТАП и его оценка с помощью глубоко размеченного корпуса русских текстов
В статье представлен синтаксический анализатор (парсер) для русского языка, входящий в состав многоцелевого лингвистического процессора ЭТАП-3, а также результаты его оценки по нескольким критериям. Оценка весьма существенным образом опирается на синтаксически размеченный корпус русского языка СинТагРус, который строится полуавтоматически: сначала каждое предложение текста обрабатывается парсером, который строит для него синтаксическую структуру в виде дерева зависимостей, а затем эта структура редактируется лингвистами-экспертами. В ходе оценки парсера корпус СинТагРус используется в качестве эталонного. Основными результатами оценки являются следующие значения параметров: 0,889 для UAS, 0,849 для LAS и 0,573 для правильности скелета структуры.
Назад