Особенности представления текста словоуказателя

Внимание: для правильного просмотра этой страницы, вам необходимо скачать и установить древнерусские шрифты: agio-converted.zip

Разработана специальная программа, позволяющая получать к введенным текстам (к каждому в отдельности или к нескольким вместе) указатели словоформ, т.е. списки словоформ с их адресами (номерами листов и строк) в рукописях.

Здесь нам также пришлось столкнуться с некоторыми проблемами. В алфавите, который Древняя Русь восприняла от южных славян, уже с самого начала были буквы, не имевшие особого фонетического значения, например, в нем было 3 буквы для звука И, 2 буквы для О, 2 буквы для Ф и т.д. К XVI в. некоторые буквы поменяли свое звуковое значение уже на русской почве, в языке развились такие фонетические явления, как аканье, позиционное оглушение и озвончение шумных согласных, все это привело к тому, что одна и та же словоформа могла быть записана несколькими способами. К тому же писцы в своей работе очень часто использовали приемы сокращенного написания слов (под титлом или с выносными буквами), и в текстах житий некоторые словоформы имеют свыше 10 вариантов написания.

Таким образом при написании программы составления словоуказателя нужно было решать проблему сведения графических вариантов словоформ к одному виду.

В тексте словоуказателя было произведено некоторое упрощение графики, которое позволяет более компактно представить словник:

  • надстрочные знаки опущены из-за того, что они расставлены по-разному в одних и тех же словах на протяжении текста рукописи;
  • выносные буквы спущены в строку и заключены в круглые скобки, это позволяет более четко соотнести слово с его буквенным составом, например ПО(Д)ВИЗИ, ЯВЛЕ­НИЕ(М);
  • титло или титловое покрытие над словом помечается в словнике особым знаком, стоящим за словом, например АГГЛЪ#.

Особая программа осуществляет частичное сведение орфографических вариантов одной и той же словоформы к единой форме:

  • объединяются словоформы с одинаковым буквенным составом, различающиеся на­ли­чи­ем/отсутствием выносных букв или тем, какие именно буквы помещены над строкой, например: БЕЗМО(Л)ВИИБЕ(З)МОЛВИИБЕЗМОЛВИИ > БЕЗМОЛВИИ; ЧЯДОРО(ДИ)ЮЧЯ(ДО)РОДИЮЧЯДОРОДИЮ > ЧЯДОРОДИЮ;
  • объединяются словоформы, различающиеся тем, как представлен конечный согласный: выносная буква/ строчная буква без ера или еря/ строчная буква с ером или ерем, например: ИГУ­МЕ(Н) – ИГУ­МЕНИГУМЕНЪ > ИГУМЕНЪ;
  • объединяются длинные (шесть и более букв) словоформы под титлом, если одна из них длин­нее/короче на одну букву другой, например: БЛЖЕННАГО# – БЛЖЕНАГО# – БЛЖНАГО# > БЛЖЕ­НАГО#;
  • объединяются словоформы, различающиеся тем, как представлена частица ЖЕ в их составе: пол­ностью или в виде выносного Ж, например: ПОНЕ(Ж)ПОНЕЖЕ > ПОНЕЖЕ;
  • объединяются словоформы, различающиеся тем, как представлено возвратное СЯ в их составе: полностью или в виде выносного С, например: ПОВИНУ(С)ПОВИНУСЯ > ПОВИНУСЯ;
  • объединяются (в диалоговом режиме) словоформы, различающиеся видом редуцированного на конце слова, например: СТАРЕЦЪСТАРЕЦЬ > СТАРЕЦЬ;
  • объединяются (в диалоговом режиме) словоформы, если букве А в одной соответствует О в другой: МАНАСТЫРЯМО­НА­СТЫРЯ > МОНАСТЫРЯ; СТУДЕНАГОСТУДЕНОГО > СТУ­ДЕ­НА­ГО; АЛ­ТА­РЯОЛТАРЯ > АЛТАРЯ.

Эта программа позволяет уменьшить объем словника на 6–10%.