Роль контекстной информации в рекомендательных системах

Время на прочтение: 2 мин

В марте 2022 года в американском научном журнале Journal of computer science опубликована статья «Сравнительный анализ различных подходов к внедрению контекстной информации в рекомендательные системы».

Рекомендательная система – это система фильтрации информации, которая пытается предсказать предпочтение пользователя в отношении определенного элемента.

В современном мире рекомендательные сервисы широко используются в различных областях. В частности, на сайтах новостей, путешествий, фильмов и музыки, интернет-магазинов, игр, ресторанов и пр.

Развитие рекомендательных систем тесно связано с развитием ИИ и расширением запросов пользователей. В этой связи его можно разделить на несколько периодов: период стабильного роста 2009-2012 гг., период быстрого роста 2013-2015 гг., период резкого роста 2016-2017 гг., и период стагнации 2018г.

В основе рекомендательных систем лежат три основных подхода: контентная фильтрация, совместная фильтрация и гибридная фильтрация.

В рамках контентной фильтрации для разработки соответствующих рекомендаций (прогнозов) используется информация о предмете. Совместная фильтрация предполагает исследование истории просмотров пользователя и разработки рекомендаций на основе сходства товара и пользователя. Гибридная фильтрация представляет собой комбинацию из двух предыдущих.

Вместе с тем, комбинация подходов не гарантирует точное совпадение рекомендации целям пользователя. Это связано с наличием других важных факторов, таких как время, погода, местонахождение и настроение пользователя. Все это контекстно обусловленные факторы, которые способны повысить производительность рекомендательных сервисов.

Авторы статьи провели анализ существующих подходов и выявили возможности по интеграции контекстной информации в рекомендательные системы. Например, Sourcetone при выборе песен учитывает настроение пользователя. Это стало возможно благодаря контекстно-зависимым рекомендательным системам (Context-Aware Recommender Systems – CARs).

Авторы отмечают интерес научного сообщества к возможностям CARs. В частности, использование скрытого контекста, построенного на последовательных действиях пользователя и использование контекстной информации из различных источников, например, текст, изображения, видео и речь.

В основе CARs лежат три основные парадигмы: контекстная префильтрация, контекстная постфильтрация и контекстное моделирование.

Для реализации парадигм исследователями предложены различные алгоритмы. Например, для префильтрации предложены алгоритмы точной предварительной фильтрации, обобщенной предварительной фильтрации, дистрибутивно-семантическая префильтрация и пр. Эти алгоритмы позволяют удалить контекстуальное измерение перед применение традиционных рекомендательных алгоритмов, которые не учитывают контекст. То есть, контекстуальная информация используется как метка для отсеивание тех оценок, которые не соответствуют заданной контекстуальной информации.

Для постфильтрации предложены алгоритмы, которые используют контекстную информацию для предоставления соответствующих рекомендаций на основе результатов традиционных рекомендательных систем. То есть, создаются рекомендации на основе всех неконтекстных рекомендаций, а потом контекстуализируются согласно заданному параметру контекста. Далее, с помощью параметров вес и фильтр анализируются данные для заданного пользователя в заданном контексте и вычисляется вероятность, с которой пользователь выбирает определенный элемент в данном контексте.

После этого алгоритмы контекстного моделирования интегрируют контекстную информацию в рекомендательную функцию. Это происходит путем формирования контекстуального профиля пользователя, который может иметь несколько переменных контекстного измерения. Например, для оценки ресторана используется две переменных для времени – будни и выходные и три переменных для местоположения – школа, дом, работа. На основе этих переменных будет происходить профилирование пользователей.

Под контекстом понимается любая информация, которая может охарактеризовать положение субъекта, то есть пользователя, объект, место. При этом, важно учитывать, что контекст влияет на действия пользователя, а действия влияют на контекст, образуя, тем самым, цикличность.

Согласно анализу авторов статьи, каждая парадигма контекстной префильтрации, постфильтрации и моделирования имеет свои достоинства и недостатки. Так, например, в парадигме префильтрации присутствует возможность сократить набор данных до актуального для заданного контекста.

В то же время контекстная интеграция предмета предполагает влияние каждого фрагмента информации на рейтинг пользователя и на каждую комбинацию элемент-пользователь и расширяет двумерную парадигму пользователь-предмет для дополнительных контекстуальных измерений.

Таким образом, дальнейшие исследования должны быть направлены на включение контекстной информации в глубокие модели обучения и включения CARs в многокритериальные рекомендательные системы и включения дополнительных контекстуальных измерений в парадигму пользователь-элемент.