автор |
сообщение |
ziza 
 философ
      
|
28 июня 2019 г. 14:22 [нажмите здесь чтобы увидеть текст поста]
|
цитата JimR Пусть классифицируют прямо в отзыве. Какой отзыв больше баллов наберёт, у того и классификация точнее. Клёво!
Отзыв — это текст в свободном формате. Классификация — это заполнение граф в анкете. Вы предлагаете их совместить и ставить плюсики тому, что получилось? Но тогда неясно, чему поставлен плюс, отзыву или классификации. Всё же это разные вещи. В отзыве посетитель озвучивает свои субъективные впечатления о книге, а классификация объективна: как бы не хотелось читателю, но если там рассказывается о пиратах, исключить их из классификации нельзя. Классификация ближе к рецензии или даже краткому пересказу книги.
|
––– Джентльмен — это человек, который знает, как играть на пианино, но не умеет этого делать Je suis Ziza |
|
|
ziza 
 философ
      
|
28 июня 2019 г. 14:40 [нажмите здесь чтобы увидеть текст поста]
|
Я сейчас более конкретно изложу идею. Просьба её покритиковать.
У нас есть текст произведения. Сейчас на Фантлабе имеется лингвистический анализ текстов, позволяющий посчитать, сколько каких частей речи, какова средняя длина предложения, оценить словарный запас автора. Используется это, например, для сравнения двух авторов или для определения возможного авторства произведения под псевдонимом.
Предлагается реализовать подобный же анализ, но для автоматической классификации текста по существующему классификатору (с возможным его расширением).
Как это реализовать, мы можем обсудить. Мне кажется, такая возможность была бы полезна. При трудностях в классификации вручную был бы ориентир и эталон.
То есть на входе текст, на выходе классификация.
|
––– Джентльмен — это человек, который знает, как играть на пианино, но не умеет этого делать Je suis Ziza |
|
|
JimR 
 миродержец
      
|
28 июня 2019 г. 14:43 [нажмите здесь чтобы увидеть текст поста]
|
цитата Календула JimR, а вы уверены, что все правильно прочитали и поняли?
Вы о книгах или о своём предыдущем посте?
цитата JimR Пусть классифицируют прямо в отзыве. Какой отзыв больше баллов наберёт, у того и классификация точнее. Клёво!
Вообще-то это была ирония.
|
––– Хорошая фантастика, это как добротный кусок сала на чёрном хлебе повседневности. - читаю Ле Фаню "Дом у кладбища" |
|
|
JimR 
 миродержец
      
|
28 июня 2019 г. 14:48 [нажмите здесь чтобы увидеть текст поста]
|
цитата ziza Я сейчас более конкретно изложу идею. Просьба её покритиковать.
Основные проблемы, навскидку: 1. Без хорошего контекстного анализа, имхо, идея обречена на провал. С учётом возможного использования слов в переносном смысле ваша классификация будет гарантированно давать сбои. 2. Не для всех произведений имеется в официальном доступе текст. 3. Для иностранных произведений вы будете анализировать оригинал или перевод? Кто будет выбирать перевод? Или вы будете загружать все имеющиеся? А если нет перевода?
|
––– Хорошая фантастика, это как добротный кусок сала на чёрном хлебе повседневности. - читаю Ле Фаню "Дом у кладбища" |
|
|
ziza 
 философ
      
|
28 июня 2019 г. 15:01 [нажмите здесь чтобы увидеть текст поста]
|
цитата JimR Без хорошего контекстного анализа, имхо, идея обречена на провал
Да, согласен. Можно не выдумывать новый способ, а посмотреть сначала готовые алгоритмы лемматизации текстов. Самый простой есть даже в Word (автоматическое реферирование).
С переносными смыслами можно справиться, составив их таблицу. Но они не очень помешают. Авторы используют стандартные приемы и сюжеты, главная задача состоит в том, чтобы распознать их в тексте.
цитата JimR Не для всех произведений имеется в официальном доступе текст.
А без текста и ручная классификация невозможна. Это уже проблема пользователя, где достать текст. Если нет полного текста, можно использовать краткий пересказ в качестве исходных данных. Но качество при этом ухудшится.
|
––– Джентльмен — это человек, который знает, как играть на пианино, но не умеет этого делать Je suis Ziza |
|
|
ziza 
 философ
      
|
28 июня 2019 г. 15:05 [нажмите здесь чтобы увидеть текст поста]
|
цитата JimR Для иностранных произведений вы будете анализировать оригинал или перевод? Кто будет выбирать перевод? Или вы будете загружать все имеющиеся? А если нет перевода?
Любой текст. Для начала хотя бы русскоязычные. Потом добавлять другие языки.
Исходный текст будет выбирать пользователь. Может быть, ему интересно сравнить два перевода или перевод с оригиналом. Можно будет и для этой цели применять.
|
––– Джентльмен — это человек, который знает, как играть на пианино, но не умеет этого делать Je suis Ziza |
|
|
pkkp 
 гранд-мастер
      
|
28 июня 2019 г. 15:07 [нажмите здесь чтобы увидеть текст поста]
|
цитата ziza Всё верно. Я сам планирую это реализовать. Пока надо разобраться, что хотелось бы, а затем с другим вопросом, то есть, возможно ли это сделать.
сообщение модератора ziza получает предупреждение от модератора Введение пользователей в заблуждение, подмену администраторов
|
|
|
Лунатица 
 философ
      
|
28 июня 2019 г. 15:10 [нажмите здесь чтобы увидеть текст поста]
|
Автоматическая классификация текстов по содержанию пока что невозможна. Параллельный перевод-то до сих пор выдает смехотворные кренделя. А вы предлагаете, чтоб машина содержание книги разложила по полочкам. Как она будет оценивать линейность и степени нелинейности сюжетов, например?
|
|
|
Paganist 
 гранд-мастер
      
|
1 июля 2019 г. 10:51 [нажмите здесь чтобы увидеть текст поста]
|
Кажется, проблемы озвученные здесь проблемы с классификатором не настолько критичны, чтобы что-то новое вводить. Как по мне, он работает наподобие статистики. Что можно сказать о стране, исходя из численности населения, площади, вероисповедания, ВВП и этнического состава? Можно только додумывать, основываясь на этих данных. Так и классификатор. Точный или нет, он не указывает на то, интересная или нет книга. Всего лишь схема, общие представления. Куда больше говорит о произведении отзыв.
|
––– Мы - дети вечности, Путь наш - дорога ветров |
|
|
SantelliBungeys 
 философ
      
|
|
k2007 
 миротворец
      
|
18 марта 2021 г. 22:08 [нажмите здесь чтобы увидеть текст поста]
|
SantelliBungeys это мнение одного конкретного читателя. Классификация проставляется пользователями сайта. Тот единственный человек, который проклассифицировал книгу, посчитал ее триллером
|
––– и придет апрель, и родится вновь, и придет уже навсегда... |
|
|
SantelliBungeys 
 философ
      
|
18 марта 2021 г. 23:50 [нажмите здесь чтобы увидеть текст поста]
|
k2007, я так же прочла эту книгу. В сюжете есть лишь один случай, который невозможно до последней главы классифицировать как убийство. При самом строгом суждении — это всего лишь действие, по неосторожности приведшее к несчастному случаю. Самокопание в себе героя, взявшего на себе "расследование" происшедшего, главная тема книга.
|
|
|
pkkp 
 гранд-мастер
      
|
|
SantelliBungeys 
 философ
      
|
|
Славич 
 миродержец
      
|
19 марта 2021 г. 00:11 [нажмите здесь чтобы увидеть текст поста]
|
цитата SantelliBungeys В сюжете есть лишь один случай, который невозможно до последней главы классифицировать как убийство. Не могу судить о книге, не прочитав её, но убийство нельзя считать обязательным сюжетным элементом триллера. В то же время, наш классификатор — не очень гибкий инструмент, он плохо описывает сложные случаи, включая так наз. "психологический саспенс" в прозе.
цитата SantelliBungeys Я новичок на сайте. И, как понимаю, не имею права вносить правки. Ошибаюсь?
В самом деле, новичкам недоступна возможность классифицировать произведения.
цитата Система классового развития является стимулирующим средством повышения активности посетителей. Стимул образует набор привилегий, предоставляемых при достижении посетителем определённого класса. Существует линейка классовых градаций. Для перехода в класс следующего уровня необходимо накопить определенное число баллов. Текущее состояние Вашего развития отображается в верхнем левом углу сайта на панельке «Вход». Существует 8 классов посетителей: 1. новичок — начальный класс, присваиваемый при регистрации. До активиста необходимо набрать 200 пунктов в развитии. 2. активист — минимальный класс, при котором вклад посетителя в сайт считается хоть сколько-нибудь весомым. Класс «активист» позволяет открывать новые темы на форуме. Начиная с этого класса оценки посетителей начинают учитываться в рейтинге авторов. До авторитета необходимо набрать 800 пунктов в развитии. 3. авторитет — могут создавать опросы на форуме. До следующего класса им нужно набрать 2000 пунктов в развитии. 4. философ — могут классифицировать произведения. До следующего класса им нужно набрать 4000 пунктов развития. 5. магистр — знатный класс для мощных, начитанных перцев. Привилегии на этом классе кончаются. Дальнейшие накопления дают лишь статус. До следующего класса им необходимо набрать 7000 пунктов в развитии. 6. гранд-мастер — до следующего класса им необходимо набрать 10000 пунктов в развитии. 7. миродержец — 15000 пунктов до миротворца. 8. миротворец — антоним новичка.
https://fantlab.ru/about#ratings
|
––– На сайте набегами, в лучшем случае. |
|
|
Гвардеец 
 миротворец
      
|
19 марта 2021 г. 00:12 [нажмите здесь чтобы увидеть текст поста]
|
цитата SantelliBungeys не имею права вносить правки. Ошибаюсь?
Это будет не правка, все понимают те или иные термины по разному, система учитывает все мнения и отображает преимущественные. Так что классифицируйте (когда получите эту возможность) так, как это представляется вам.
|
––– Подъезжая к сией станцыи и глядя на природу в окно, у меня слетела шляпа. И.Ярмонкин |
|
|
SantelliBungeys 
 философ
      
|
|
Славич 
 миродержец
      
|
19 марта 2021 г. 00:17 [нажмите здесь чтобы увидеть текст поста]
|
цитата SantelliBungeys Я не могу в силу статуса Пока не можете. 3000 баллов развития, чтобы получить статус "философ", — это всего 600 оценок прочитанным рассказам или романам.
|
––– На сайте набегами, в лучшем случае. |
|
|
SantelliBungeys 
 философ
      
|
|
k2007 
 миротворец
      
|
19 марта 2021 г. 08:57 [нажмите здесь чтобы увидеть текст поста]
|
цитата SantelliBungeys Другими словами — жанр книги изменить нельзя
напишите человеку, который классифицировал роман, в личку, поговорите с ним. Может быть, под влиянием ваших аргументов он изменит классификацию
|
––– и придет апрель, и родится вновь, и придет уже навсегда... |
|
|