20 лет Google: как работает алгоритм и почему он иногда приводит не туда

20 лет Google: как работает алгоритм и почему он иногда приводит не туда
Foto: Reuters/Scanpix

Вопросы, которые не надо задавать Google - такие вообще есть? Учитывая 20-летнюю историю поисковика и постоянное совершенствование алгоритма кажется, что правильный ответ - нет. Но есть нюансы.

Казусов, когда на запрос выдавались весьма неожиданные результаты, за историю поисковика хватало.

В своё время апдейты Panda и Penguin радикально упростили выявление так называемых "чёрных шляп" - страниц-ловушек с искомыми ключевыми словами в заглавии, но с нерелевантным и никак не отвечающим на вопрос пользователя содержанием.

Тем не менее, странности иногда происходят до сих пор.

Например, электрик, IT-специалист и блогер Райан Дьюб несколько лет назад пытался получить ответ на вопрос: "Как поменять лопнувшую шину".

Перелистав 18 страниц рекламы клея для шин и повторяющих друг друга бессмысленных рекомендаций, мужчина нашёл ответ лишь на 19-й по счёту странице при демонстрации 10 ссылок на страницу.

Кто главный идиот?

Особенно достаётся поиску по картинкам - часто пользователи ставят один и тот же тэг рядом с загружаемым ими изображением, выводя его в топ по тому или иному запросу.

В конце августа юзеры рунета заметили, что, если ввести в поиск Google слово "аутист", в топе выдачи окажется фотография российского президента Владимира Путина.

В топе запроса по не совсем корректному наименованию людей с расстройствами аутистического спектра появляются также мэр Киева Виталий Кличко, петербургский видеоблогер Михаил Совергон и основатель Microsoft Билл Гейтс.

Оппозиционные флешмобы оказались ни при чём: дело в том, что месяц назад юзеры снова стали активно делиться статьёй 2015 года "Путин - аутист?" с сайта "ИноСМИ.ру" - перевод материала французского журнала Le Point с проверкой заявлений некоторых американских специалистов, что герой статьи болен аутизмом.

На данный момент Путин - пятый в верхнем ряду по тому же запросу.

В июле россияне обратили внимание, что в топе запросов по слову "идиот" Google-картинки выдают демотиватор со всё тем же Виталием Кличко рядом с иллюстрациями к одноимённому роману Фёдора Достоевского, а вот написание этого же слова латиницей выводит на первое место президента США Дональда Трампа, с которым очень неожиданно соседствует Альберт Эйнштейн - англоязычные пользователи часто пытаются не совсем корректно выяснить, не был ли гениальный физик носителем синдрома Аспергера.

На конец сентября Трамп попал в топ и кириллических запросов по слову "идиот", разбавив иллюстрации к Достоевскому.

Ответ компании

Би-би-си уточнила у Google, как именно совершенствуется алгоритм поиска ответа на вопросы пользователей. В компании ответили так:

"Ежедневно Google обрабатывает миллиарды запросов. Около 15% из них поисковая система видит впервые.

Чтобы пользователи быстро получали актуальные и релевантные результаты, Google использует системы ранжирования, которые упорядочивают сотни миллиардов страниц в поисковом индексе.

Они состоят из наборов алгоритмов. Благодаря постоянной оптимизации Google Поиска алгоритмы всё более точно определяют, что интересует пользователей и какие результаты следует показать.

Существует ряд способов, которые позволяют предоставлять пользователям подходящие сведения при помощи алгоритмов Google Поиска: анализ слов и выражений, подбор подходящих страниц, ранжирование релевантных страниц и т.д.

В 2015 годы Google стал использовать для поисковой выдачи систему искусственного интеллекта RankBrain, созданную на основе машинного обучения.

RankBrain помогает алгоритмам системы правильно интерпретировать и обрабатывать запросы пользователей, чтобы найти релевантные страницы."

Source info

BBC News Русская служба


Copyrights

Категорически запрещено использовать материалы, опубликованные на DELFI, на других интернет-порталах и в средствах массовой информации, а также распространять, переводить, копировать, репродуцировать или использовать материалы DELFI иным способом без письменного разрешения. Если разрешение получено, нужно указать DELFI в качестве источника опубликованного материала.

Статьи по теме: