fantlab ru



  Лингвистический анализ произведения
Произведение: Небесная тропа
Автор: Марианна Алфёрова
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:365667
Слов в произведении (СВП):52968
Приблизительно страниц:183
Средняя длина слова, знаков:5.22
Средняя длина предложения (СДП), знаков:51.23
СДП авторского текста, знаков:65.06
СДП диалога, знаков:39.58
Доля диалогов в тексте:42.03%
Доля авторского текста в диалогах:10.34%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:8417
Активный словарный запас (АСЗ):8046
Активный несловарный запас (АНСЗ):371
Удельный АСЗ на 3000 слов текста:1267.69
Удельный АСЗ на 10000 слов текста:3009.30 —> 3442-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:11642 (21.98% от СВП)
Определённых частей речи (ОЧР), слов:41326 (78.02% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное13605 (32.92%)
          Прилагательное4163 (10.07%)
          Глагол10555 (25.54%)
          Местоимение-существительное4069 (9.85%)
          Местоименное прилагательное2197 (5.32%)
          Местоимение-предикатив4 (0.01%)
          Числительное (количественное)491 (1.19%)
          Числительное (порядковое)113 (0.27%)
          Наречие2259 (5.47%)
          Предикатив448 (1.08%)
          Предлог4926 (11.92%)
          Союз3837 (9.28%)
          Междометие905 (2.19%)
          Вводное слово118 (0.29%)
          Частица3360 (8.13%)
          Причастие689 (1.67%)
          Деепричастие100 (0.24%)
Служебных слов:19516 (47.22%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное4317588.87.8.001.5.418.8.9529254.9.50155.2.43
Прилагательное447.5131.81.2.00.27.181.2.363.54.2.70.0931.9.34
Глагол4416241310.022.389.21.438173.6.18102.4.36
Местоимение-существительное96.5306.33.3.05.72.055.916.33.3.34.3612.50.18
Местоименное прилагательное214.97.41.71.3.00.27.091.4.432.81.5.14.092.6.50.02
Местоимение-предикатив.00.00.05.00.02.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)4.91.2.99.27.32.00.23.05.11.09.54.65.09.02.61.14.00
Числительное (порядковое)1.5.09.18.02.05.00.05.05.05.02.07.20.00.00.07.09.02
Наречие5.33.8144.31.2.00.54.052.563.52.7.52.144.4.70.11
Предикатив.79.272.2.68.36.00.02.00.61.25.61.72.11.02.72.02.00
Предлог61152.89.213.002.81.79.09.141.3.07.00.741.9.00
Союз155.622123.5.02.61.055.5.866.33.8.56.347.63.14
Междометие6.21.41.44.51.1.00.02.001.2.07.931.3.11.021.2.07.05
Вводное слово.29.18.36.63.09.00.00.00.00.07.20.25.05.00.18.00.00
Частица8.93.83261.8.00.88.052.8.994.75.2.65.165.1.68.11
Причастие6.91.6.72.34.20.00.07.00.47.022.8.70.11.02.32.16.00
Деепричастие.38.11.20.14.07.00.02.00.07.00.59.09.02.00.16.02.05

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное21202226262829283130
Прилагательное5.56.77.37.28.37.69.38.69.110
Глагол15262423222219201919
Местоимение-существительное14129.18.16.565.15.94.84.9
Местоименное прилагательное2.34.95.14.54.54.53.954.54.2
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.21.901.90.901.11.21.70
Числительное (порядковое).30.30.20.20.30.20.20.10.10.10
Наречие6.55.94.43.44.13.74.43.33.42.5
Предикатив1.81.1.901.2.60.80.50.50.60.40
Предлог6.76.29.59.99.41010101112
Союз1266.467.67.47.37.26.67
Междометие5.3111.21.51.61.81.31.21.4
Вводное слово.40.30.20.10.20.20.20.10.20.10
Частица7.77.67.36.16.56.25.96.25.56
Причастие.30.80.8011.51.21.52.11.51.8
Деепричастие.30.20.20.20.20.20.30.20.30.20

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая120.03
          .    точка98.06
          -    тире41.46
          !    восклицательный знак12.40
          ?    вопросительный знак14.84
          ...    многоточие6.80
          !..    воскл. знак с многоточием0.11
          ?..    вопр. знак с многоточием0.34
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием1.47
          "    кавычка11.61
          ()    скобки0.45
          :    двоеточие5.53
          ;    точка с запятой0.11




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Марианна Алфёрова
 48
2. Анна Гурова
 41
3. Дмитрий Емец
 40
4. Кирилл Бенедиктов
 40
5. Марина и Сергей Дяченко
 40
6. Аня Сокол
 39
7. Александр Варго
 39
8. Борис Акунин
 39
9. Анна Чарова
 39
10. Иван Сербин
 39
...смотреть весь список >>
⇑ Наверх