* Данный текст распознан в автоматическом режиме, поэтому может содержать ошибки
существует при обработке замкнутого корпуса целиком (как, например, в слу чае текстов Д о с т о е в с к о г о ) . 3) Наконец, существует и психологический фактор. Лингвостатистика, как она складывалась в середине XX в., в какой-то степени была во власти математического фетишизма: открытие «закона» Ципфа создавало иллюзию новой области статистических исследований, возникала новая дисциплина, все более терявшая связи с лингвистикой, филологией, информатикой. Предлагаемый Словарь должен сделать шаг в обратном направлении. 1. Корпус текстов Достоевского и его членение Настоящий Словарь опирается на 30-томное академическое издание Ф, М. Достоевского и в основном следует принципам классификации текстов, принятым в этом издании, т. е. включает три основных жанра — «Художествен ная литература», «Критика и публицистика» и «Письма». Эти три жанра в сово купности и составляют корпус текстов Достоевского, послуживший базой для всех статистических таблиц «Статистического словаря языка Достоевского». Общий объем корпуса — 2 8 8 9 тыс. графических с л о в ( 1 4 5 9 8 0 разных графиче ских с л о в ) , в том числе: «Художественная литература» — 1835 тыс. слов ( 1 1 0 7 4 4 разных графических с л о в а ) , «Критика и публицистика» — 524 тыс. слов ( 5 9 4 4 6 разных графических с л о в ) , «Письма» — 5 3 1 тыс. слов ( 4 3 6 8 9 разных графических с л о в ) . Не вошли в наш корпус текстов ранние редакции и вари анты, подготовительные материалы и тексты записных книжек. Применение ста тистических методов к подобным текстам было бы почти невозможным. Не вошли в корпус и деловые бумаги, где индивидуальность автора почти не проявля ется. Разумеется, эти группы текстов должны учитываться при составлении и с черпывающего словника Достоевского. Ряд текстов из «Дневника писателя» отнесен к художественной л и т е р а туре: «Бобок», «Кроткая», «Мальчик у Христа на елке», «Мужик Марей», «Сон смешного человека», «Столетняя». 1 2. Лингвистические единицы, отраженные в статистических таблицах В настоящем Словаре представлены как исходные графические слова (только в электронной части С л о в а р я ) , так и результаты всевозможных п р о ц е дур над графическими словами (слияние разных грамматических форм слова, слияние вариантов, р а с щ е п л е н и е , объединение в одну единицу двух и более графических слов, следующих друг за д р у г о м ) . Прежде всего р е ч ь идет об о р фографических вариантах {адрес и адресе, прощание и прощанье) , в которых могли проявляться орфографические нормы времени или пристрастия издателей. Подобные варианты объединяются в одну единицу. С другой стороны, сохранена статистическая информация о таких вариантах, как бриллиант и брильянт, Ав дотья Сергеевна и Авдотья Сергевна, вести и весть. Некоторые графические слова разделяются на две или д а ж е три леммы. Речь идет о частицах вроде -де, -ка, -с, -таки, -то. Однако сохраняются н е расчлененными слова с «неопределенным» -то, присоединяемым к основам вопро сительных (и некоторых указательных) местоимений {где-то, какой-то, откудато, такой-то) . Что касается грамматических форм изменяемых слов, то здесь доминирует традиционное представление о частях речи (например, графические слова на -о, вроде абсурдно, бездарно, безобразно, вековечно, расщепляются на н а р е чия и п р и л а г а т е л ь н ы е ) . Однако, вслед за Словарем Пушкина, компаративы с о храняются как отдельные грамматические единицы (при этом формы на -ее и -ей сливаются в о е д и н о ) . Отдельно фигурируют и суперлативы. Термин «графическое слово» представляется более правильным, чем общепринятый термин «словоформа». Один раз встретившееся у Достоевского слово взяточка-то-с заслуживает названия «графическое слово», но вряд ли будет идентифицировано лингвистами как особая «словоформа». Точно так же графическое слово ви-но-ват, встретившееся три раза, едва ли кем-либо будет объявлено особой словоформой. С другой стороны, встре тившаяся последовательность по...за...буду... («Белые ночи») в словаре графических слов будет отражена как три слова, в словаре лемм — прибавит единицу к частоте сло ва позабыть.