Рекомендующая система информационной поддержки принятия решений в области туризма. Часть 4

Рекомендующая система информационной поддержки принятия решений в области туризма. Часть 4

Для автоматизированной фильтрации или ранжирования объектов могут применяться два основных подхода: контентный анализ и пользовательская оценка. Контентный анализ предполагает составление формализованной модели объекта и связь параметров этой модели с численной мерой качества. Подход с использованием пользовательской оценки перекладывает всю сложность определения соответствия объекта тем или иным качественным характеристикам на пользователя.

Ввиду значительной трудоемкости разработки формальной модели изображения, позволяющей оценить его качество, а также упомянутой уже сложности и неоднозначности самой категории качества изображения, для автоматизированного ранжирования изображений было решено воспользоваться методом пользовательской оценки. То есть пользователь мобильного приложения имеет возможность оценивать демонстрируемые ему изображения достопримечательностей, эти оценки сохраняются в хранилище информации рекомендующего сервиса и в дальнейшем используются для отбора и ранжирования изображений, показываемых всем пользователям. Самая лучшая киевская гостиница «На Лукьяновке», которую можно найти на сайте superhotel.kiev.ua. По многочисленным отзывам, «На Лукьяновке» занимает первое место среди туристов и просто приезжих, отмечено также высококвалифицированный сервис, уровень удобства и месторасположение.

При разработке алгоритма выбора показываемых изображений учитывались следующие факторы:

а)            пользователю должны демонстрироваться изображения, положительно оцененные другими пользователями;

б)           для того чтобы разнообразить перечень изображений, сопровождающих ту или иную достопримечательность, необходимо включать в выборку и изображения, не имеющие оценок, давая возможность пользователю оценить их;

в)            изображения, имеющие отрицательную оценку, также следует показывать, поскольку отрицательная оценка, например, могла быть поставлена пользователем ошибочно. Однако такие изображения должны составлять незначительную часть от демонстрируемых.

Перечисленные факторы оказывают различное, в том числе взаимоисключающее влияние на результирующий список. Формирование списка производится эвристическим алгоритмом, учитывающим веса, присвоенные различным факторам.

В качестве шкалы оценок, с помощью которой пользователь может выразить свое отношение к показанному ему изображению, используется бинарная шкала: «Нравится» / «Не нравится». Выбор шкалы продиктован тем, что шкалы с большим количеством значений используются обычно в специализированных системах, где важно как можно точнее установить отношение пользователя к объекту. Наличие пункта «Не нравится» призвано уменьшить возможность демонстрации пользователям нежелательных и/или не связанных с достопримечательностью изображений с минимальным административным участием.

Как уже указывалось, помимо изображений, пользователю предоставляется возможность ознакомиться с текстовой информацией, касающейся интересующей его достопримечательности. Для каждой достопримечательности из внешних источников выбирается несколько текстовых блоков, однако одновременное их отображение пользователю сильно перегрузит графический интерфейс. Соответственно, возникает необходимость выбора блока, который будет показан в первую очередь. После ознакомления с содержимым текстового блока пользователь может перейти к следующему, и здесь тоже возникает необходимость выбора. Задача состоит в том, чтобы определить такую последовательность показа текстовых блоков, чтобы у пользователя как можно быстрее сформировалось наиболее полное впечатление о достопримечательности.

Для выбора последовательности демонстрации текстовых блоков пользователю было решено воспользоваться комбинацией методов контентного анализа и пользовательской оценки. Как и в случае с изображениями, пользователю дается возможность оценить качество показанного ему блока - эта информация записывается в хранилище информации рекомендующего сервиса. Однако помимо пользовательских оценок для некоторых поддерживаемых языков (русский, английский) при ранжировании учитываются и собственные характеристики текста.

Таким образом, перечень факторов, принимаемых во внимание при определении очередного демонстрируемого блока, следующий:

а)            пользовательская оценка качества блоков;

б)           характеристики текстовых блоков: объем, разнообразие лексики;

в)            степень сходства содержимого блоков с последним показанным.

Остановимся на этих факторах подробнее. Пользователь может пометить текстовый блок как понравившийся ему. Интегральная пользовательская оценка для блока (u,) определяется как количество пользователей, которые пометили данный блок как понравившийся.

Главной целью оценки собственных характеристик текстового блока является установление факта того, насколько текст: а) подходит для получения краткой справки о достопримечательности на мобильном устройстве и б) разнообразен. Предполагается, что сервисы-источники информации о достопримечательностях достаточно надежны и тексты в них достаточно качественны, то есть задача защиты от спама не ставится.

В настоящее время используется всего две характеристики содержимого блока: объем блока в байтах (l,) и количество различных имен существительных и именованных сущностей на количество символов в блоке (q,). Причем объем блока оценивается по функции, имеющей максимум, соответствующий некоторому рекомендованному объему блока (10 Кб).

Степень сходства текстовых блоков определяется как значение косинусной меры между содержимым блоков, представленным в виде векторной модели документа.

29 октября 2013 /
Похожие новости
Рекомендующая система информационной поддержки принятия решений в области туризма. Часть 3
Рекомендующая система информационной поддержки принятия решений в области туризма. Часть 2
Рекомендующая система информационной поддержки принятия решений в области туризма. Часть 1
Методы преобразования аэрокосмического изображения
Фотокарта
Комментарии

НАПИСАТЬ КОММЕНТАРИЙ

Ваше Имя:
Ваш E-Mail:
Полужирный Наклонный текст Подчеркнутый текст Зачеркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера
Вопрос:
Сколько часов 1 сутках?
Ответ:*
Введите код: