fantlab ru



  Лингвистический анализ произведения
Произведение: Богатство
Автор: Валентин Пикуль
Дата проведения анализа: 21 февраля 2023 года

Общая статистика

Длина текста, знаков:484704
Слов в произведении (СВП):69637
Приблизительно страниц:252
Средняя длина слова, знаков:5.46
Средняя длина предложения (СДП), знаков:67.65
СДП авторского текста, знаков:91.22
СДП диалога, знаков:49.66
Доля диалогов в тексте:41.75%
Доля авторского текста в диалогах:5.42%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:11676
Активный словарный запас (АСЗ):10668
Активный несловарный запас (АНСЗ):1008
Удельный АСЗ на 3000 слов текста:1389.13
Удельный АСЗ на 10000 слов текста:3404.85 —> 565-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:14372 (20.64% от СВП)
Определённых частей речи (ОЧР), слов:55265 (79.36% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18741 (33.91%)
          Прилагательное6368 (11.52%)
          Глагол12298 (22.25%)
          Местоимение-существительное4633 (8.38%)
          Местоименное прилагательное2692 (4.87%)
          Местоимение-предикатив12 (0.02%)
          Числительное (количественное)538 (0.97%)
          Числительное (порядковое)110 (0.20%)
          Наречие2921 (5.29%)
          Предикатив506 (0.92%)
          Предлог7265 (13.15%)
          Союз4699 (8.50%)
          Междометие950 (1.72%)
          Вводное слово145 (0.26%)
          Частица3774 (6.83%)
          Причастие879 (1.59%)
          Деепричастие125 (0.23%)
Служебных слов:24295 (43.96%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное522753119.7.071.4.28121.235254.28145.4.54
Прилагательное606.3141.6.69.00.26.071.7.364.14.9.66.072.51.2.35
Глагол412017129.3.031.5.337.3138152.8.368.53.12
Местоимение-существительное106.6244.42.4.02.57.055.3.785.64.1.52.509.4.55.05
Местоименное прилагательное1966.11.7.69.00.29.021.3.483.21.7.26.052.6.41.03
Местоимение-предикатив.02.00.12.02.00.00.02.00.00.00.00.00.00.00.02.00.00
Числительное (колич-ое)3.91.1.73.21.29.02.31.09.09.03.52.71.03.03.48.00.02
Числительное (порядковое)1.1.07.17.02.02.00.02.00.02.00.03.03.00.00.12.03.00
Наречие5.34.7153.91.1.03.31.022.1.644.72.5.31.144.2.90.05
Предикатив.79.411.8.64.21.00.16.00.41.16.71.79.09.02.69.03.02
Предлог73163.29.412.001.5.48.19.19.161.07.00.541.1.07
Союз167.114103.3.02.86.125.8.867.33.5.73.285.4.86.24
Междометие4.81.113.21.1.00.03.05.76.1411.09.03.76.09.00
Вводное слово.36.29.45.21.02.00.02.00.21.03.03.21.02.00.31.05.00
Частица7.23.1285.41.7.00.76.072.3.574.74.2.40.104.2.60.07
Причастие5.51.5.66.24.31.00.09.00.67.053.5.55.14.00.31.09.00
Деепричастие.41.10.24.19.05.00.00.00.03.00.60.12.00.00.21.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное17212527283131313032
Прилагательное5.37.68.28.69.68.99.9111110
Глагол17232222211918161717
Местоимение-существительное13118.77.46.46.15.85.75.14.3
Местоименное прилагательное2.34.84.143.7444.34.35.1
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).901.70.90.90.70.80.401.60
Числительное (порядковое).20.20.20.20.10.10.10.20.10.00
Наречие7.25.64.24.23.93.53.53.83.33.8
Предикатив1.811.60.80.70.30.50.60.80
Предлог117.81010111212111211
Союз116.96.26.36.46.76.76.97.26.2
Междометие5.211.111.21.11.2.901.31.1
Вводное слово.50.40.20.10.10.10.10.30.20.10
Частица7.17.87.15.95.95.45.25.15.15.4
Причастие.40.7011.11.41.21.421.51.9
Деепричастие.30.20.10.20.20.10.10.20.10.20

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая110.20
          .    точка64.76
          -    тире28.72
          !    восклицательный знак9.87
          ?    вопросительный знак11.40
          ...    многоточие16.51
          !..    воскл. знак с многоточием0.14
          ?..    вопр. знак с многоточием0.16
          !!!    тройной воскл. знак0.01
          ?!    вопр. знак с восклицанием0.07
          "    кавычка13.01
          ()    скобки1.57
          :    двоеточие9.75
          ;    точка с запятой0.78




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Борис Акунин
 40
2. Zотов
 40
3. Юрий Гаврюченков
 39
4. Александр и Людмила Белаш
 38
5. Василий Аксёнов
 38
6. Владимир Свержин
 38
7. Ярослав Веров
 38
8. Сергей Волков
 38
9. Виктория Дьякова
 38
10. Александр Зорич
 37
...смотреть весь список >>
⇑ Наверх