КОРПУСНАЯ ЛИНГВИСТИКА-2008

Конференция Темы Организационный комитет Контакты English/Русский
 
 
Конференция
Темы
Организационный комитет
Контакты
English/Русский 
 
Гарабик Р.

A Simple Russian-Slovak Machine Translation System

Статья описывает систему автоматического перевода текста, обоснованную на расширенных морфологических союзах между двумя языками, пользуясь простыми правилами для выбора подходящих грамматических пар. Снятие семантической и морфологической омонимии проводится применением цепи Маркова первого или второго порядка, которая тренирована на большом одноязычном корпусе.

Этот подход можно применить к паре языков с сравнительными синтаксическими и морфологическими чертами, как например к русскому и словацкому. Генетические сходства между русской и словацкой лексиками можно использовать для увеличения качества перевода при помощи схемы транслитерации слов отсутствующих в словаре. В статье далее проведен анализ нескольких свойств словаря (количество слов, шум) и их влияние на качество окончательного перевода.

Назад