fantlab ru



  Лингвистический анализ произведения
Произведение: Там, где цветёт полынь
Автор: Ольга Птицева
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:860981
Слов в произведении (СВП):129526
Приблизительно страниц:445
Средняя длина слова, знаков:5.18
Средняя длина предложения (СДП), знаков:53.85
СДП авторского текста, знаков:65.23
СДП диалога, знаков:37.52
Доля диалогов в тексте:28.75%
Доля авторского текста в диалогах:7.8%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:10847
Активный словарный запас (АСЗ):10377
Активный несловарный запас (АНСЗ):470
Удельный АСЗ на 3000 слов текста:1203.11
Удельный АСЗ на 10000 слов текста:2684.97 —> 8210-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:9653.20
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:29277 (22.60% от СВП)
Определённых частей речи (ОЧР), слов:100249 (77.40% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное32298 (32.22%)
          Прилагательное11821 (11.79%)
          Глагол26012 (25.95%)
          Местоимение-существительное9717 (9.69%)
          Местоименное прилагательное5349 (5.34%)
          Местоимение-предикатив26 (0.03%)
          Числительное (количественное)1182 (1.18%)
          Числительное (порядковое)295 (0.29%)
          Наречие5627 (5.61%)
          Предикатив862 (0.86%)
          Предлог12133 (12.10%)
          Союз9242 (9.22%)
          Междометие1847 (1.84%)
          Вводное слово432 (0.43%)
          Частица8017 (8.00%)
          Причастие2731 (2.72%)
          Деепричастие255 (0.25%)
Служебных слов:47018 (46.90%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное3619587.38.1.001.3.339.5.7727244.62147.7.59
Прилагательное498.6171.5.98.00.22.101.6.343.85.3.89.092.72.5.18
Глагол4117241411.111.7.529.7142143.1.50123.49
Местоимение-существительное8.27.3314.82.6.03.70.115.4.764.93.8.38.649.7.75.13
Местоименное прилагательное1767.22.21.5.00.21.051.5.332.81.9.22.073.3.88.07
Местоимение-предикатив.03.00.09.03.00.00.00.00.00.00.00.01.00.00.01.00.00
Числительное (колич-ое)3.91.1.87.33.29.01.22.04.06.13.49.64.08.02.98.19.00
Числительное (порядковое)1.5.14.21.05.04.00.01.02.06.01.08.22.01.00.07.05.00
Наречие4.74.3164.31.2.00.45.062.4.353.22.4.45.123.61.1.10
Предикатив.58.321.6.67.20.00.09.00.25.07.34.40.07.01.65.06.02
Предлог59151.91111.001.6.66.90.22.05.87.04.00.403.9.03
Союз137.821103.2.04.66.175.2.764.63.7.46.436.71.1.15
Междометие5.51.41.62.51.00.01.06.04.75.12.761.1.05.03.72.31.02
Вводное слово.37.27.84.57.13.00.04.01.16.02.21.25.04.00.34.00.00
Частица8.55314.91.5.001.6.062.8.753.34.2.53.165.96.22
Причастие111.7.96.49.55.00.04.02.82.055.6.66.35.09.37.42.02
Деепричастие.42.16.32.14.14.00.00.00.06.02.45.11.01.00.26.06.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное20192125262828292929
Прилагательное6.58.18.28.49.6109.9109.511
Глагол12282723212019191919
Местоимение-существительное16107.87.56.36.55.55.65.34.8
Местоименное прилагательное2.94.144.14.34.14.84.84.44.2
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.11.31.901.80.90.70.70.60
Числительное (порядковое).30.20.30.20.20.20.30.10.20.30
Наречие6.36.14.44.23.73.73.83.53.73.8
Предикатив1.5.80.80.70.60.50.40.50.50.40
Предлог6.25.69.611101011101111
Союз1465.56.16.56.26.76.47.16.6
Междометие4.2.70.901.21.21.41.41.21.3.90
Вводное слово.80.50.40.30.30.20.20.20.20.20
Частица7.77.97.25.865.85.45.35.65.9
Причастие11.31.61.82.42.42.42.72.82.7
Деепричастие.20.20.20.20.20.20.30.20.20.10

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая123.55
          .    точка101.89
          -    тире26.70
          !    восклицательный знак3.28
          ?    вопросительный знак12.68
          ...    многоточие7.47
          !..    воскл. знак с многоточием0.01
          ?..    вопр. знак с многоточием0.09
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.00
          "    кавычка3.38
          ()    скобки0.01
          :    двоеточие1.98
          ;    точка с запятой0.03




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Ольга Птицева
 49
2. Аня Сокол
 38
3. Альбина Нури
 38
4. Марина и Сергей Дяченко
 38
5. Карина Шаинян
 37
6. Рута Шейл
 37
7. Вероника Мелан
 37
8. Сергей Давиденко
 37
9. Диана Удовиченко
 37
10. Оливия Штерн
 37
...смотреть весь список >>
⇑ Наверх