САНКТ-ПЕТЕРБУРГСКИЙ КОРПУС
АГИОГРАФИЧЕСКИХ ТЕКСТОВ |
Особенности представления текста словоуказателяВнимание: для правильного просмотра этой страницы, вам необходимо скачать и установить древнерусские шрифты: agio-converted.zip Разработана специальная программа, позволяющая получать к введенным текстам (к каждому в отдельности или к нескольким вместе) указатели словоформ, т.е. списки словоформ с их адресами (номерами листов и строк) в рукописях. Здесь нам также пришлось столкнуться с некоторыми проблемами. В алфавите, который Древняя Русь восприняла от южных славян, уже с самого начала были буквы, не имевшие особого фонетического значения, например, в нем было 3 буквы для звука И, 2 буквы для О, 2 буквы для Ф и т.д. К XVI в. некоторые буквы поменяли свое звуковое значение уже на русской почве, в языке развились такие фонетические явления, как аканье, позиционное оглушение и озвончение шумных согласных, все это привело к тому, что одна и та же словоформа могла быть записана несколькими способами. К тому же писцы в своей работе очень часто использовали приемы сокращенного написания слов (под титлом или с выносными буквами), и в текстах житий некоторые словоформы имеют свыше 10 вариантов написания. Таким образом при написании программы составления словоуказателя нужно было решать проблему сведения графических вариантов словоформ к одному виду. В тексте словоуказателя было произведено некоторое упрощение графики, которое позволяет более компактно представить словник:
Особая программа осуществляет частичное сведение орфографических вариантов одной и той же словоформы к единой форме:
Эта программа позволяет уменьшить объем словника на 6–10%. |