
* Данный текст распознан в автоматическом режиме, поэтому может содержать ошибки
встретившиеся в данном жанре с частотой менее 0,000005, показаны многото чием. Следует помнить, что Средняя, указанная в первом столбце, это — сред няя взвешенная, т. е. получена с учетом неравного объема трех макрожанров. Таблица 3 «100 самых частых лемм в текстах Достоевского» представляет собой верхнюю часть рангового словаря. Символы г и f читаются как «ранг» и «частота» соответственно. Аналогично устроены таблица 4 «100 самых частых лемм в художественных произведениях Достоевского», таблица 5 «100 самых частых лемм в критике и публицистике Достоевского», таблица б «100 самых частых лемм в письмах Достоевского». Большей наглядностью для читателя обладают таблицы, в которых вер хушка рангового словаря представлена в распределении по знаменательным час тям речи. Это таблица 7 «40 самых частых существительных», таблица 8 «40 самых частых глаголов», таблица 9 «40 самых частых прилагательных». В этих таблицах каждый столбец посвящен своему основному жанру, внутри столбца слова упорядочены по убыванию частоты. Информация о ранговом словаре (полностью представленном в электронной части) завершается четырьмя таблицами, в которых фигурируют только числа, Это таблица 10 «Частотный спектр рангового словаря лемм всего корпуса тек стов», таблица 1 1 «Частотный спектр рангового словаря лемм беллетристики», таблица 12 «Частотный спектр рангового словаря лемм критики и публици стики», таблица 13 «Частотный спектр рангового словаря лемм писем». Четыре столбца этих таблиц интерпретируются следующим образом: в первом столбце показан ранг леммы в ранговом словаре. Цифры в последней строке первого столбца указывают на число разных лемм — 43577 во всем корпусе, 34257 в ху дожественной литературе, 21448 в критике и публицистике, 17367 в письмах. Во втором столбце показана частота слова данного ранга, в третьем — накоп ленная частота всех слов с данным рангом и ниже. Последняя строка этого столбца — совокупная частота лемм данного корпуса. Заметим, что эта цифра несколько меньше числа графических слов, поскольку среди лемм довольно много словосочетаний. Наконец, в четвертом столбце дается накопленная отно сительная частота, т. е. результат деления накопленной частоты данного ранга на совокупную частоту лемм. Следующие три таблицы показывают лексические маркеры основных жанров. Это таблица 14 «Лексические маркеры беллетристики», таблица 15 «Лексические маркеры критики и публицистики», таблица 16 «Лексические маркеры писем». Лексические маркеры поданы здесь в алфавитном порядке. Таблицы 1 7 , 18 и 19 содержат информацию о лексических маркерах, упорядоченных по убыванию S и тем отличающихся от таблиц 1 4 - 1 6 . В кратком виде эта информация представ лена в таблице 0 0 3 . В таблицах 20 и 2 1 представлена грамматическая информация — редкий гость в частотных словарях. В таблице 20 даются абсолютные частоты во всем корпусе и по трем основным жанрам; в таблице 2 1 та же информация подана в виде относительных частот. Грамматические классы включают традиционные части речи и некоторые подклассы внутри частей речи. Особо выделены деадъективные наречия, и з м е нившие свои синтаксические функции: примером могут служить лексемы до вольно, следовательно, действительно, точно, давно, конечно. Русские суф фиксы соотнесены с частями речи и с грамматическими подклассами внутри час тей речи. Так они и сгруппированы в данных таблицах. Что касается префик сов, то они хорошо коррелируют с мотивирующими основами в процессе слово производства, но результирующие производные слова (часто осложненные суф фиксами) уже прямо не соотнесены с частями речи. Префиксы и первые компо ненты сложных слов поданы в общем алфавитном порядке. Поскольку в префиксальных образованиях часто наблюдается процесс м о р фологического опрощения, особо выделяются группы слов с этимологическим префиксом, чья семантическая мотивация частично или полностью затуманена. Примером может служить группа слов с начальным в-: вкус, влияние, вменять, вместо, вовсе, внедрить, внезапно, вникнуть, внимание, вонзить, вперить, впечатление, впиться, вплоть, впросак, вряд, всадник. Такие группы слов д а ются в таблицах как отдельные строки, причем префикс в таком случае .сопро вождается знаком звездочки ( * ) .