Технологии 22-08-2019, 10:07
Источник ТАСС

«Яндекс» рассказал о способах поиска забытых фильмов

Для этого аналитики компании использовали запросы-описания сюжетов

Фото: Екатерина Шутяк/ nao24.ru

Аналитики "Яндекса" выяснили, что больше всего запоминается зрителям в кино. Для этого специалисты изучили запросы-описания сюжетов, по которым пользователи пытались найти в интернете название того или иного фильма, сообщает пресс-служба компании.

"Оказалось, например, что в воспоминаниях о российском кино особенно часто фигурируют "подруги" и "менты". В описаниях турецких фильмов - невесты и богатые парни, для запросов про индийское кино характерно упоминание братьев и крокодилов", - говорится в исследовании.

При описании советских фильмов особенно много "пьют" и "поют", в запросах про российское кино - "сажают в тюрьму" и "попадают в прошлое". Также в российских фильмах что-то часто происходит "в деревне" и "в Новый год", в американских - "на вечеринке" и "в Рождество". Герои комедий обычно "отдыхают", "меняются" местами, телами или супругами и в кого-нибудь "переодеваются". Для фильмов ужасов характерны сцены "в доме", "в лесу" и "в подвале", для боевиков - "в здании", "в пустыне" и "в джунглях". 

Что касается персонажей, то "мужья и жены" возглавили топы сразу двух жанров - мелодрамы и триллера.

Аналитики также определили, чем именно запоминаются персонажи. Оказалось, что женщин характеризует в первую очередь то, что они кого-то "рожают", а мужчин - что они кого-то или что-то "видят": "девушек", "призраков", "будущее".

Типичный "демон" - "вселяется", "охотится" и "забирает". "Агент" - "внедряется" и "спасает". "Вампиры" в воспоминаниях о фильмах "влюбляются" даже чаще, чем "кусают".

Запросы про забытые фильмы в основном уникальны: люди обращают внимание на разные вещи и даже одну и ту же памятную сцену описывают по-разному. В отличие от обработки типовых запросов, про которые поиск по опыту, то есть по статистике переходов на сайты из выдачи, знает, что хочет найти человек, показать нужные ссылки в ответ на что-нибудь вроде [фильм где в космосе говорящий барсук и дерево] - это очень нетривиальная задача. Но и очень важная: редкие и необычные запросы задают не только про кино, они вообще составляют огромную часть от всего потока.

Чтобы отвечать на них, "Яндекс" использует традиционные поисковые алгоритмы в сочетании с нейросетевыми технологиями. Например, с помощью нейросети оценивается смысловая близость уникального запроса к каждому из множества частотных, для которых известен хороший ответ.

Так, запрос про говорящего барсука и дерево похож на [фильм в котором говорящий енот и дерево], который в свою очередь похож на [фильм где енот дерево и звездный лорд], на который, наконец, поиск может уверенно ответить ссылкой на страницы фильма "Стражи галактики", потому что видит, что в их текстах важное место занимают словосочетания из запроса. Чтобы нейросеть лучше справлялась с уникальными запросами, ее обучают на редких запросах из истории поиска - посвященных другим темам, но не менее неповторимых.


Следите за нашим Telegram-каналом чтобы быть в курсе последних новостей



comments powered by HyperComments