RussNet: тезаурус  русского языка
English version

Проект RussNet

В настоящее время особую популярность и широкое распространение приобрели электронные тезаурусы типа WordNet. Проект RussNet посвящен созданию подобного ресурса для русского языка. Его разработка ведется с 1999 года исследовательской группой под руководством И. В. Азаровой (Кафедра математической лингвистики Филологического факультета Санкт-Петербургского государственного университета). За это время в проекте приняли участие 57 лингвистов и программистов, основная группа состоит из 8 человек.

Целью проекта является построение лескико-семантического ресурса,
  • отражающего организацию лексической системы русского языка в целом (в противоположность терминологическим или частным словарям);
  • покрывающего ядро общеупотребительной лексики русского языка;
  • фиксирующего все семантические, семантико-грамматические и семантико-деривационные отношений, характерные для русского языка.
RussNet унаследовал основные особенности Принстонского WordNet, EuroWordNet и других подобных ресурсов:
  • Тезаурус состоит из 4-х взаимосвязанных файлов, содержащих слова основных частей речи: существительные, глаголы, прилагательные и наречия.
  • Базовой единицей RussNet является синонимический ряд (синсет), объединяющий слова со сходным значением.
  • Синсеты связаны различными парадигматическими и синтагматическими отношениями.

Текущее состояние

В настоящее время основные усилия сосредоточены на разработке внутриязыковой структуры RussNet. Недостаточное покрытие уровней пока не позволяет нам присоединить наши данные к Inter-Lingual-Index.

Текущий объем

Тезаурус включает ~15 тыс. лексико-семантических вариантов (ЛСВ), организованных в ~5500 синсетов, из них
  • 1300 существительных,
  • 1900 глаголов,
  • 1100 прилагательных,
  • 200 наречий.

Кроме того, для окончательного редактирования подготовлено еще 10-12 тыс. синсетов.

Рейтинг@Mail.ru
  Ваши комментарии и замечания пишите на russnet@yandex.ru  Последнее обновление 14 июня 2005