
* Данный текст распознан в автоматическом режиме, поэтому может содержать ошибки
ПРЕДИСЛОВИЕ технологии лежит корпус филологически выверенных авторских текстов, снабженных богатой структур ной, филологической и грамматической разметкой. Размеченный корпус является единственной надежной основой для проведения серьезных филологических исследований, свободных от субъективизма и иллю стративности. Размеченный корпус текстов А. С. Грибоедова создан с участием автора в ходе работы над проектом «Фундаментальная электронная библиотека "Русская литература и фольклор"». Отличительной особенно стью данного корпуса является полнота и высокий уровень подготовки, поскольку он формируется на ос нове наиболее авторитетных изданий и все тексты подвергаются глубокой филологической обработке. Все тексты в корпусе точно идентифицированы, имеют полноценное библиографическое описание и на бор формальных библиографических атрибутов. Тексты представлены на специальном языке разметки, который соответствует современным стандартам на представление данных и обеспечивает широкие воз можности для автоматической обработки. Все тексты содержат детальную разметку структурных элемен тов текста (заголовки, действия, явления, реплики, ремарки, строки, страницы), что необходимо для точ ной адресации каждого фрагмента текста. Грамматическая разметка корпуса основывается на «Грамматическом словаре русского языка» А. А. За лизняка. Каждое словоупотребление в корпусе характеризуется следующими признаками: лексема (сло варная форма), грамматические признаки лексемы (часть речи, род, одушевленность, вид), грамматиче ские признаки словоформы (число, падеж, наклонение, время). Предварительная грамматическая разметка корпуса была выполнена при помощи программы, за которую автор приносит искреннюю благодарность ее разработчикам — специалистам компании «Яндекс». Затем полученная разметка была подвергнута су щественной ручной переработке, включая выбор вариантов разбора, снятие омонимии, разбор нераспо знанных слов, исправление ошибок. Пришлось решать многочисленные грамматические проблемы, свя занные с неизбежными различиями между языком эпохи Грибоедова и современным русским языком. Размеченный корпус представляет собой базу, которая дает возможность проводить объективные ис следования авторского языка, а также легко получать различные виды словарей: конкордансы, частотные, обратные, грамматические, с разделением по видам текстов, видам речи, персонажам и т. д. В отличие от традиционных методов филологической работы, данная технология изначально ориенти рована на электронную форму представления информации. Электронная форма открывает целый ряд воз можностей, недоступных в бумажной форме: динамический поиск и отбор лексики по любым критериям, динамическая сортировка и группировка, просмотр словаря в различных видах, быстрый переход из сло варя в корпус текстов, выдача информации в различных форматах. Кроме того, электронная форма не имеет ограничений по объему, которые существенно влияют на форму представления информации в тра диционных печатных словарях. Основной формой словаря является алфавитно-частотный конкорданс к авторским текстам, где лексе мы отсортированы в алфавитном порядке, а словоупотребления внутри статьи — по грамматической форме. Путем различной проекции и сортировки из той же самой словарной базы получаются другие ви ды словарей: частотный словарь, где лексемы сгруппированы в порядке убывания частоты; обратный ал фавитный словарь; грамматический словарь, где лексемы сгруппированы по грамматическим признакам; словари отдельных произведений или персонажей. Кроме того, исследователь всегда сможет получить нужную ему проекцию словаря по запросу. Возможность динамического получения новых видов слова рей (в том числе не предусмотренных первоначальным замыслом) является абсолютно новым словом в практике филологической работы. Все эти возможности доступны в электронной версии словаря, а печат ный словарь является ее образом, который адаптирован к требованиям эдиционной практики и представ ляет информацию в более компактном и удобном для восприятия виде. При создании данного словаря был проанализирован опыт существующих словарей языка русских пи сателей, в частности: 1) Словарь языка Пушкина: В 4 т. / Отв. ред. акад. АН СССР В. В. Виноградов. 2-е изд., доп. М., 2001. 2) ShawJ. Th. Pushkin: A Concordance to the Poetry. Slavica Publishers, 1975. II