Что называется дизамбигуацией

Что такое дизамбигуация

Дизамбигуацией называется специальный программный инструмент, который входит в состав алгоритмов поисковых систем. Эти алгоритмы работают со словами с различным толкованием, которые очень часто набирают посетители в строке поисковика. При применении способа дизамбигуации поисковики способны увеличить релевантность выдачи.

Содержание:

Устранение неоднозначного толкования

В отечественных поисковиках удаление неоднозначного толкования производится снятием омонимии и глубоким анализом сочетаний слов. Дополнительно поисковики используют дизамбигуацию, которая оперирует окружающим необходимое выражение контекстом.

Можно предположить, что посетитель вводит такое поисковое предложение, как «позолоченные вилки». Алгоритм поисковика, а если немного точнее, то его часть, которая отвечает за удаление любой неоднозначности, определяет основной смысл фразы, немедленно отсекает и потом не пропускает в выдачу такие сочетания слов, как «вилки овощей», «вилки инструментов» и «руководство не способно больше удерживать вилки стоимости». Иначе говоря, в процессе дизамбигуации различается экономика, овощеводство и электричество.

Пример дизамбигуации

Убирая неоднозначность слов, алгоритм не нагружает сервера поисковиков, чистит от похожей и ненужной информации строку выдачи. Намного сложнее, если посетитель вводит только слово, например, просто «вилки». Полное отсутствие смысла фразы лишает возможности качественного использования дизамбигуации. При подобных случаях поисковики применяют другие инструменты, к примеру, используют статистику, отражающую количество обращений посетителей с таким запросом к поисковой системе. По отношению к вилкам Яндекс, например, в верхних строчках выдачи покажет информацию не о столовых приборах, а о ресурсах букмекерских компаний, в которых очень часто применяется термин букмекерской вилки.

Дизамбигуация

Дизамбигуация – сложный алгоритм

Из-за того, что жизнедеятельность человека все больше начинает привязываться к частому применению инструментов из сети и пользованию поисковиками, то усовершенствованием качественно работающих механизмов по дизамбигуации стали заниматься компетентные люди в сфере знания языков и математического моделирования. Такая работа довольно сложная и связана с особенной лексико-семантической разборкой огромного числа сочетаний слов на некоторые омонимические составляющие. Основные результаты подобной научной и исследовательской работы применяются для успешного усовершенствования алгоритмов поисковиков.

Всем известно, что сначала поисковая система не понимает, каким в определенном случае обязан быть смысл фразы. Специально для этого ее необходимо обучить. Для увеличения качества работы исследователи применяют абсолютно все существующие способы лексического и математического анализа. К примеру, часто используются методы, которые применялись при разработке иностранных семантических систем FrameNet и WordNet.

С уважением, Евгений Кузьменко.

Оставь комментарий первым

Оставить комментарий

Ваш e-mail не будет опубликован.


*