Fоtо: Vida Press
Онлайн-переводчик Google Translate в очередной раз привлек к себе внимание пользователей и СМИ благодаря тому, что перевел "Российская Федерация" с украинского языка на русский как "Мордор". Это далеко не первый случай оскорбления чувств пользователей машинными алгоритмами. "Газета.Ru" разобралась в механике их возникновения.

Во вторник, 5 января, соцсети пестрили публикациями скриншотов, на которых Google Translate переводит словосочетание "Російська Федерація" с украинского на русский как "Мордор", а фамилию "Лавров" — "грустная лошадка".

В Google объяснили, почему Россия, по мнению сервиса-переводчика, вдруг превратилась в вымышленную страну и сосредоточие зла в Средиземье из легендариума Дж. Р.Р. Толкина. В компании заверили, что Google Translate — это автоматический переводчик, работающий без участия людей, но при помощи алгоритмов. Для создания наиболее качественного перевода алгоритмы анализируют огромные массивы документов и публикаций, как оригиналов, так и их переводов, сделанных людьми. Если в переводе обнаруживается грубая ошибка, то компания старается незамедлительно справиться с ней, сообщил представитель Google. Принцип работы переводчика Google подробно описывается здесь:

Как же вышло, что Россия стала Мордором? В интернете можно найти множество статей, где "Мордор" и "Россия" используются в одном контексте. Среди них и сомнительные теории, согласно которым в образе пристанища Саурона Дж. Р.Р. Толкин изобразил СССР, впоследствии же "титул" перешел к России. Тема России-Мордора широко обсуждалась, когда в Москве планировалось установить инсталляцию "Око Саурона". А журналист Леонид Бершидский в статье для Bloomberg, например, назвал Россию Мордором, а Украину — Широм, родиной хоббитов.

Фамилия "Лавров", наиболее часто упоминающаяся в публикациях СМИ о министре иностранных дел России Сергее Лаврове, могла получить столь странный перевод по схожей причине. Так, ранее в Запорожье был установлен памятник, который представляет российского государственного деятеля в образе лошади. Об этом писали украинские издания, что и привело к тому, что переводчик Google запутался именно в этих двух языках.

Алгоритмы Google Translate просто дали сбой, анализируя украинские и российские источники. А на фоне обострившихся российско-украинских отношений подобные казусы привели к достаточно нелепым переводам.

Вообще же сервисы Google уже не раз попадали впросак с использованием собственных алгоритмов. Одним из самых громких роботизированных оскорблений Google стали запросы "nigger house" и "nigga house", которые выдавали в результатах поиска на Google Maps резиденцию президента США Барака Обамы в Вашингтоне. Причиной таких результатов поиска стала социальная сеть Google+, записи в которой использовались для нанесения и уточнения информации об объектах на картах. В большом количестве из них встречались эти словосочетания.

Поднятая волна критики в СМИ и со стороны обычных американских пользователей заставила компанию оперативно сделать заплатки в алгоритмы, и Белый дом перестал выводиться по этим запросам. Но внимательные пользователи на этом не остановились и нашли еще один запрос — "nigga king", который также указывал на резиденцию Барака Обамы.

Ранее Google пришлось закрыть функцию добавления объектов на Google Maps после того, как по определенным географическим координатам на них появилось изображение логотипа Android, справляющего малую нужду на логотип конкурента — Apple.

Таким образом, пользователи зачастую сами препятствуют развитию сервисов Google на основе пользовательского контента, и сторонние картографические сервисы, такие как созданная российскими разработчиками Wikimapia.org, получают на рынке некоторые преимущества.

Зачастую ляпы алгоритмов выглядят как шутки разработчиков или даже попытки "потроллить". Например, в начале 2010 года Google Translate переводил одну и ту же словесную конструкцию "is to blame" (англ. "виноват") по-разному в контексте России и российского президента и США и американского президента. Для России и Медведева перевод был "виноват", для США и Обамы — "не виноват". Позже различие в переводах в разном контексте было убрано.

В конце 2010 года появился знаменитый перевод фразы: "Доброе утро, Дмитрий Анатольевич!", которая в английском варианте у Google Translate превращалась в "Good morning, Mr President".

Версия с баловством разработчиков, конечно, имеет право на жизнь. Однако за пять лет транснациональная корпорация, чьи миллиардные прибыли могут быть поставлены под угрозу подобными действиями, должна была внести изменения в работу с персоналом. Внесла или нет - мы не знаем, но "шуточки алгоритмов" продолжают появляться с завидной регулярностью.

В декабре 2015 года Google Translate по-прежнему допускал "дискриминацию" в переводе в зависимости от контекста. Так, "Россия присоединила" переводилось как "Russia joined", а "россия присоединила" (со строчной буквы "р") — как "Russia annexed", то есть "Россия аннексировала".

При этом для слова "Америка" в той же конструкции заглавная или строчная "а" значения не имела. Можно предположить, что те пользователи интернета, которые считали ситуацию с Крымом "аннексией", могли писать "россия" со строчной "р", выражая тем самым свое неуважение. Подобные различия в переводе слова "joined" в сервисе можно было наблюдать для Франции, Норвегии и Шотландии.

Еще одним уязвимым для действий пользователей сервисом является Google Street View. Google регулярно обновляет снимки городских улиц в разных городах, чтобы изменения местности отражались и в панорамах. Если сейчас курьезы и скандалы чаще связаны с местным колоритом и случайно попавшими на камеру сценами секса на улице, то постепенно сервис становится ареной для самовыражения пользователей и проявления определенной гражданской позиции. Так, австралийские женщины начали демонстрировать машинам Google обнаженную грудь как протест против вторжения корпорации в личную жизнь жителей.

Тем не менее в череде случайностей есть если не позитивные, то полезные примеры. В ноябре прошлого года благодаря Google Street View был обнаружен автомобиль с телом человека, считавшегося пропавшим без вести в течение девяти лет.

Читайте нас там, где удобно: Facebook Telegram Instagram !