Рогов А.А., Гурин Г.Б., Котов А.А. Некоторые особенности грамматически размеченного корпуса по русской публицистике второй половины ХIХ века
В докладе описываются особенности корпуса русских публицистических текстов 19 века в оригинальной орфографии, создаваемого в Петрозаводском государственном университете на базе программного комплекса "Статистические методы анализа литературных текстов" (СМАЛТ). Корпус в настоящее время снабжен морфологической разметкой двух типов, системой поиска, улавливающей орфографическую вариативность. В заключении доклада описываются перспективы развития корпуса, в частности возможность синтаксической разметки.
Назад