fantlab ru



  Лингвистический анализ произведения
Произведение: Дыша духами и туманами...
Автор: Геннадий Прашкевич
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:136772
Слов в произведении (СВП):20145
Приблизительно страниц:72
Средняя длина слова, знаков:5.4
Средняя длина предложения (СДП), знаков:46.03
СДП авторского текста, знаков:48.53
СДП диалога, знаков:30.56
Доля диалогов в тексте:9.29%
Доля авторского текста в диалогах:6.93%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:4831
Активный словарный запас (АСЗ):4658
Активный несловарный запас (АНСЗ):173
Удельный АСЗ на 3000 слов текста:1299.59
Удельный АСЗ на 10000 слов текста:3064.02 —> 2811-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:4541 (22.54% от СВП)
Определённых частей речи (ОЧР), слов:15604 (77.46% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное5470 (35.06%)
          Прилагательное2032 (13.02%)
          Глагол3807 (24.40%)
          Местоимение-существительное1391 (8.91%)
          Местоименное прилагательное655 (4.20%)
          Местоимение-предикатив4 (0.03%)
          Числительное (количественное)209 (1.34%)
          Числительное (порядковое)43 (0.28%)
          Наречие825 (5.29%)
          Предикатив132 (0.85%)
          Предлог2051 (13.14%)
          Союз1205 (7.72%)
          Междометие352 (2.26%)
          Вводное слово80 (0.51%)
          Частица1128 (7.23%)
          Причастие301 (1.93%)
          Деепричастие42 (0.27%)
Служебных слов:6908 (44.27%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное45235795.001.5.90101.831185.41.2146.48
Прилагательное6910151.4.36.00.36.06.96.483.72.81.123.41.2.36
Глагол441823137.1.122.1.306.6040133.8.488.12.5.42
Местоимение-существительное7.77.3235.53.9.001.4.067.21.35.83.7.78.488.7.30.18
Местоименное прилагательное146.35.41.21.3.00.36.18.72.122.11.3.24.002.6.72.06
Местоимение-предикатив.06.00.06.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)4.41.31.4.48.42.00.30.30.12.12.60.60.06.00.90.00.00
Числительное (порядковое).72.06.48.00.00.00.00.00.06.00.06.12.00.06.12.12.00
Наречие4.94.1174.11.4.00.78.001.7.4841.7.42.303.91.1.12
Предикатив.78.362.1.30.30.00.06.00.30.00.36.72.06.00.36.06.00
Предлог68233.78.39.8.002.60.54.12.12.42.12.00.423.2.06
Союз154.214103.00.78.124.5.546.42.3.90.186.4.48.00
Междометие7.81.324.21.00.12.00.36.001.1.72.06.00.90.18.00
Вводное слово.66.241.3.30.06.00.00.00.12.06.48.60.06.00.60.00.00
Частица8.13.9273.41.1.001.3.002.6.546.14.1.72.244.3.96.36
Причастие8.52.48.24.42.00.00.00.36.003.6.30.06.00.12.18.06
Деепричастие.36.18.66.00.06.00.00.00.06.00.30.12.00.00.24.06.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное16242728303033333434
Прилагательное8.99.57.99.89.4121212139.8
Глагол17192421231918181715
Местоимение-существительное13107.46.64.95.65.24.73.34.6
Местоименное прилагательное2.24.63.72.92.73.73.2333.6
Местоимение-предикатив.00.00.00.00.00.00.10.00.00.00
Числительное (колич-ое).801.41.4.60.80.70.901.51.61.4
Числительное (порядковое).00.40.30.20.10.10.30.40.00.30
Наречие6.95.63.73.42.92.73.63.533.2
Предикатив1.50.80.90.90.30.40.20.80.60
Предлог99.68.8121212119.61111
Союз125.15.34.44.84.855.55.66.2
Междометие4.31.31.11.31.41.61.71.21.41.6
Вводное слово.90.70.20.30.30.30.10.20.00.30
Частица7.16.67.15.84.74.44.94.64.46
Причастие.601.11.21.71.721.41.81.72.2
Деепричастие.20.30.10.20.30.20.30.10.40.50

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая109.70
          .    точка115.22
          -    тире26.01
          !    восклицательный знак9.03
          ?    вопросительный знак18.52
          ...    многоточие4.72
          !..    воскл. знак с многоточием0.10
          ?..    вопр. знак с многоточием0.15
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.05
          "    кавычка40.51
          ()    скобки3.13
          :    двоеточие6.25
          ;    точка с запятой0.35




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Волков
 32
2. Борис Акунин
 32
3. Zотов
 32
4. Геннадий Прашкевич
 32
5. Данил Корецкий
 32
6. Марина и Сергей Дяченко
 31
7. Олег Рой
 31
8. Александр Рудазов
 31
9. Дмитрий Емец
 31
10. Василий Аксёнов
 31
...смотреть весь список >>
⇑ Наверх