Внимание: для правильного просмотра этой страницы, вам необходимо скачать и
установить древнерусские шрифты: agio-converted.zip
Разработана специальная программа, позволяющая получать к введенным текстам
(к каждому в отдельности или к нескольким вместе) указатели словоформ, т.е.
списки словоформ с их адресами (номерами листов и строк) в рукописях.
Здесь нам также пришлось столкнуться с некоторыми проблемами. В алфавите,
который Древняя Русь восприняла от южных славян, уже с самого начала были буквы,
не имевшие особого фонетического значения, например, в нем было 3 буквы для
звука И, 2 буквы для О, 2 буквы для Ф и т.д. К XVI в. некоторые буквы поменяли
свое звуковое значение уже на русской почве, в языке развились такие
фонетические явления, как аканье, позиционное оглушение и озвончение шумных
согласных, все это привело к тому, что одна и та же словоформа могла быть
записана несколькими способами. К тому же писцы в своей работе очень часто
использовали приемы сокращенного написания слов (под титлом или с выносными
буквами), и в текстах житий некоторые словоформы имеют свыше 10 вариантов
написания.
Таким образом при написании программы составления
словоуказателя нужно было решать проблему сведения графических вариантов
словоформ к одному виду.
В тексте словоуказателя было произведено
некоторое упрощение графики, которое позволяет более компактно представить
словник:
- надстрочные знаки опущены из-за того, что они
расставлены по-разному в одних и тех же словах на протяжении текста
рукописи;
- выносные буквы спущены в строку и заключены в круглые
скобки, это позволяет более четко соотнести слово с его буквенным составом,
например ПО(Д)ВИЗИ, ЯВЛЕНИЕ(М);
- титло или титловое покрытие над
словом помечается в словнике особым знаком, стоящим за словом, например
АГГЛЪ#.
Особая программа осуществляет
частичное сведение орфографических вариантов одной и той же словоформы к единой
форме:
- объединяются словоформы с одинаковым буквенным составом, различающиеся
наличием/отсутствием выносных букв или тем, какие именно буквы помещены над
строкой, например: БЕЗМО(Л)ВИИ – БЕ(З)МОЛВИИ –
БЕЗМОЛВИИ > БЕЗМОЛВИИ; ЧЯДОРО(ДИ)Ю –
ЧЯ(ДО)РОДИЮ – ЧЯДОРОДИЮ > ЧЯДОРОДИЮ;
- объединяются словоформы, различающиеся тем, как представлен конечный согласный:
выносная буква/ строчная буква без ера или еря/ строчная буква с ером или ерем,
например: ИГУМЕ(Н) – ИГУМЕН – ИГУМЕНЪ >
ИГУМЕНЪ;
- объединяются длинные (шесть и более букв) словоформы
под титлом, если одна из них длиннее/короче на одну букву другой, например:
БЛЖЕННАГО# – БЛЖЕНАГО# – БЛЖНАГО# >
БЛЖЕНАГО#;
- объединяются словоформы, различающиеся тем, как
представлена частица ЖЕ в их составе: полностью или в виде выносного
Ж, например: ПОНЕ(Ж) – ПОНЕЖЕ > ПОНЕЖЕ;
- объединяются словоформы, различающиеся тем, как представлено возвратное
СЯ в их составе: полностью или в виде выносного С, например:
ПОВИНУ(С) – ПОВИНУСЯ > ПОВИНУСЯ;
- объединяются
(в диалоговом режиме) словоформы, различающиеся видом редуцированного на конце
слова, например: СТАРЕЦЪ – СТАРЕЦЬ > СТАРЕЦЬ;
- объединяются (в диалоговом режиме) словоформы, если букве А в одной
соответствует О в другой: МАНАСТЫРЯ – МОНАСТЫРЯ >
МОНАСТЫРЯ; СТУДЕНАГО – СТУДЕНОГО >
СТУДЕНАГО; АЛТАРЯ – ОЛТАРЯ >
АЛТАРЯ.
Эта программа позволяет уменьшить объем словника на
6–10%.