Новый алгоритм рекомендаций



 внимание!  20 ноября 2007 г. 16:21 

Новый алгоритм рекомендаций

С сегодняшнего дня в тестовом режиме начинает работу новый (естественно, улучшенный) алгоритм рекомендаций.

Основные новшества:

  1. возможность самому указать предпочтения: новинки/классика, наши/зарубежные. Внимание! Это именно предпочтение, а не жёсткое правило. То есть в «предпочтительно новинки» может попасть и старое произведение, если у него рейтинг несоизмеримо больше, чем у всех новинок. Поскольку понятие «новинка» для зарубежной литерутуры имеет несколько иной смысл (пока книгу переведут, она уже и не новинка вовсе), введена дополнительная корректировка в алгоритм ранжирования. Зарубежные произведения считаются новинками гораздо дольше, чем наши. Если оба критерия выбраны в «не имеет значения», то предпочтение всё равно отдаётся новым произведениям, но в 10 раз меньшее, чем при выборе «преимущественно новинки». Это компенсирует недостаток оценок у новых книг на фоне сильнооценённой классики.

  2. в романы теперь не попадают те, которые входят в цикл и не являются его началом;

  3. если оценён цикл или любое его произведение, то в рекомендации не попадёт ни сам цикл, ни одно из прочих его произведений;

  4. в каждой категории (циклы, романы, рассказы) один автор может присутствовать только один раз;

  5. рекомендации вычисляются процентов на 40 быстрее и, при этом, кешируются, делая повторный просмотр страницы максимально быстрым;

  6. отправлять произведения в мусорку теперь стало гораздо удобнее.

  7. раздел «незримые связи» перенесён из главного меню в «рекомендации»

Ещё раз повторю — алгоритм пока работает в тестовом режиме. Если Вы обнаружили ошибки/недоработки или просто не согласны с результатом выдачи, пишите мне в личку.

разместил creator


  Комментарии посетителей
(2007-11-20) Kamima:

А можно попросить в версию для печати рекомендуемых книг выносить только автора и название...

 
(2007-11-20) PetrOFF:

Испробовал, вроде хорошо всё. Претензий нет !

 
(2007-11-20) newcomer:

Хорошо получилось, спасибо в очередной раз.

 
(2007-11-20) creator:

Исправил пару багов. 8:-0 Так что если меняется список — не пугайтесь.

 
(2007-11-20) Pupsjara:

А можно ли самому достоверность менять? А то мои рекомендации состоят теперь наполовину из произведений со средней или низкой достоверностью.

 
(2007-11-20) kkk72:

Вот это да! creator — молодец!:cool!:

 
(2007-11-20) irish:

Здоровски. Раздел "Рекомендации" действительно стал интереснее (хотя я им все равно не пользуюсь =)) *размечтавшись* а теперь еще бы возможность задавать предпочтения по жанрам...

 
(2007-11-20) necrotigr:

УБийственно хорошая новость!!! Браво!!!:beer:

 
(2007-11-20) Dark Andrew:

И каким образом работает "только первый роман цикла". Берём "Академию" Азимова — должна рекомендоваться "Академия", хотя по счету она стоит третьей.

 
(2007-11-21) Shvoloch:

Вроде все неплохо.Но...В рекомендациях выдает много книг с высоким прогнозируемым

баллом,но низкой достоверностью.В идеале,конечно,было бы самому ставить приоритет:

оценка или достоверность.Но все же не очень верится в рекомендацию при достоверности

7 при том,что порог оцененности у меня стоит в 200 книг...А по умолчанию,наверное,все

же именно достоверность прогнозируемой оценки стоит на 1 месте.

ПС.Я уже как-то предлагал,но попробую еще раз:а нельзя ли сделать так,чтобы прогноз

будущей оценки выдавался на каждую книгу,а не только на максимально рекомендуемые,

что-то вроде того,что реализовано на имхонете...

 
(2007-11-21) creator:

Dark Andrew, "Академия" является первым романом в подцикле "Основная трилогия", поэтому она может появиться в рекомендациях.

Низкие достоверности присущи как правило новинкам. Если ввести ещё несколько чисто технических параметров, таких как достоверность, то рекомендации станут интуитивно менее понятными, целостными и удобными.

"не очень верится в рекомендацию при достоверности 7 при том,что порог оцененности у меня стоит в 200 книг"

Потому и достоверность низкая, что ты порог взвинтил до двухсот — единомышленников ведь стало на порядок меньше.

"что-то вроде того,что реализовано на имхонете"

А что такое имхонет? :-)))

Прогноз выдается на каждую книгу. С чего ты взял, что не на каждую.

ЗЫ: ещё кое-что доработал по части удобства.

 
(2007-11-21) creator:

Убрал детскую литературу из рекомендаций. А то Карлсон на первом месте далеко не всем может понравиться.

 
(2007-11-21) Shvoloch:

То,что у новинок низкий уровень достоверности,это понятно.Но в данном случае,когда

я смотрел рекомендации и выбрал оба параметра "не имеет значения" там были только

новинки,зато когда выбрал в первом пункте "преимущественно классика",то сразу все

наладилось с достоверностью.Порог в 200 у меня стоит уже очень давно и, когда я его

поставил, отличия от предыдущего порога в 150 были минимальными,зато возросла

достоверность оценки(для чего я его и увеличивал).Мне не очень понятно преимущество

высокой недостоверной оценки перед более низкой,но с высокой достоверностью в

рекомендациях.

Насчет imhonet.ru -это бывший imhoclub.ru ,и хотя куда-то исчез раздел ссылок на сайте,

но точно помню ,что раньше они были нашими партнерами.

То,что прогноз ОБРАБАТЫВАЕТСЯ на каждую книгу,это точно,но каким образом я могу

посмотреть во сколько баллов и с какой достоверностью прогноз оценивает мое

прочтение,к примеру,"Восхода Эндимиона" Симмонса?Не удалять же бесконечно в корзину

книги из рекомендаций,чтоб на вторые сутки дойти до той книги,что интересует?А на том

сайте,на который я ссылался, в шапке самой книги стоит сразу и прогнозируемая оценка

(конечно,при достаточном количестве оценивших единомышленников).

 
(2007-11-21) creator:

"там были только новинки"

Че ты народ обманываешь?! :-) У тебя там есть "Голубятня на желтой поляне" (1985), "Бойцовский клуб" (1996), "Альтист Данилов" (1981), "Герой должен быть один" (1996). Какие же это новинки?

Да, я не и отрицаю что когда "год не имеет значения" значение он всё-таки имеет, но очень-очень малое.

Какой мне и всем остальным толк, что ты сейчас прочитаешь и оценишь "Властелин Колец"?.. Ноль. Абсолютно никакого. А вот прочитай лучше "Обманы Локки Ламоры", да отзыв напиши. И будет целый вагон пользы для других читателей, которые ещё думают покупать или не покупать.

Если не будет крохотного приоритета за новинками, то в рекомендациях будут только старые высокооценённые произведения. Но должна же быть какая-то динамика из года в год!

Я ещё по секрету тебе скажу. Достоверность низкая и достоверность высокая — это почти одно и то же. 20 оценок единомышленников — это более чем репрезентативная выборка. А тебе зачем-то нужны сотни и тысячи.

Что такое имхонет я знаю. :) О партнёрстве (которое было лишь банальным обменом ссылок) уже никакой речи не идёт.

"Не удалять же бесконечно в корзину книги из рекомендаций,чтоб на вторые сутки дойти до той книги,что интересует?"

Опа! А вот это высказывание противоречит всей системе вообще.

Зачем тебе тогда рекомендации, если ты и сам знаешь что тебя интересует, а что нет? Значит, у тебя в голове (или на бумажке) есть готовый список того, что ты хочешь прочитать, и ты сейчас занимаешься тем, что ПОДГОНЯЕШЬ рекомендации по свой список "to read".

В этом, извини, система бессильна. Система РЕКОМЕНДУЕТ. Если тебя рекомендации не устраивают, значит они тебе не нужны, значит ты читаешь со собственным спискам.

И таких, как ты очень много, если не большинство. Вы все подгоняете рекомендации по своим желаниям. Но поймите, что система прогнозирует оценку, а не угадывает желание. Смысла от угадывания вашего желания нет никакого.

И если вы, получив рекомендацию, лишь удостоверились в своих желаниях ("о! система правильно работает"), то нахрена тогда вообще эта система нужна, если она не влияет на ваш выбор?

И не цепляйтесь вы к достоверностям. Уберу их вообще, чтобы не смущали.

 
(2007-11-21) Shvoloch:

creator

А вот и нет ))) "Бойцовский клуб" (1996), "Альтист Данилов" (1981), "Герой должен быть один" (1996)

уже давно из рекомендаций выпали. Вот в доказательство приложил бы саму страничку, но тут

вложения нет. Потому просто скажу, что в том виде, как сейчас, у меня только "Голубятня на

желтой поляне" в рекомендациях романов написана до 1990 года.

"Я ещё по секрету тебе скажу. Достоверность низкая и достоверность высокая — это почти одно и то же. 20 оценок единомышленников — это более чем репрезентативная выборка. А тебе зачем-то нужны сотни и тысячи".

Ну, о сотнях и тысячах речи и в помине не было, но для того, чтобы получить не очень грубую

корреляцию, нужно еще и как можно большее количество совместно оцененных произведений

(так называемый порог оцененности), и когда мы учили мат. вероятность и основы надежности, то вроде бы там говорилось, что для построения сложного нелинейного графика (по сути задача

близкая к мат. корреляции множества графиков оценок единомышленников/антиподов и получения

суммарного графика возможных распределений оценок для данного юзера) 20 точек все же недостаточно...

Алексей, не злись все же... Я вот так вижу эту проблему, рекомендации — это нечто вроде

своеобразного предварительного хит-парада, оценка может совпасть, а может и нет. Но я не делаю

список тех книг, которые буду читать. Часто просто подхожу к книжной полке и в итоге выберу

совсем не то, за чем шел, или куплю новую книгу, и заброшу дочитывать те, что уже давно читаю...

Конечно же, я и сам прекрасно заранее знаю, что меня интересует, но когда я покупаю новые

книги, то тут влияют и рекомендации и мнения многих участников сайта и еще куча факторов.

"Если тебя рекомендации не устраивают, значит они тебе не нужны, значит ты читаешь со собственным спискам".

С чего ты взял? Все прекрасно работает, просто те возможности, что я предложил, лично для меня

были бы интересны. Ведь книг, которые интересуют, очень много, а в рекомендациях место

ограничено. Система и не должна ничего угадывать, она лишь просчитывает возможную вероятность.

Просто чтобы выдать конечный результат, ей все равно приходится рассчитать эту вероятность

для всех книг, а потом выстроить их по рангу. Вот я и предлагал, чтобы была возможность увидеть

все эти оценки, а не только верхушку.

 
(2007-11-21) Darinella:

Очень интересно получилось... По крайней мере, понятнее, чем раньше, да и не попадаются больше в рекомендациях уже оцененные и прочитанные произведения, как это бывало раньше. Очень просто и понятно. Спасибо!:-)

 
(2007-11-21) cyborg:

Виват креатору! Даешь жанры!

 
(2007-11-22) Claviceps P.:

Очень полезные новшества и усовершенствования! Спасибо, Алексей! :beer:

 
(2007-11-22) Михаль:

В алгоритме есть какая-то ошибка. В рекомендациях мне указана "Суета вокруг дивана" Стругацких, которая является частью "Понедельника". А на "Понедельник ..." я уже написала отзыв (2007-11-18)

 

  Ваш комментарий
Ваше имя:
Комментарий:
доступно после регистрации —>
⇑ Наверх