Fоtо: Kadrs no video
Британский математик и программист Стивен Вольфрам, развивающий язык программирования имени себя, объявил о запуске ресурса, который способен понять содержание картинки, которую ему дает пользователь. Как часто бывает в таких случаях, этот сайт — только вершина айсберга.

Любой желающий может пройти на сайт www.imageidentify.com и "скормить" ему какое-нибудь изображение. Сайт подумает секунду и выдаст ответ. Если изображение банальное, ответ в большинстве случаев будет верный. Но если отдать ему почтовую марку 1995 года с изображением Лачплесиса (как сделали мы), то ответ будет не очень полезным.

С другой стороны, нельзя не заметить, что машина ошибается "по-человечески". То есть, в большинстве случаев всегда можно понять, почему ответ именно такой, а не какой-нибудь другой. Марка с Лачплесисом действительно похожа на суперобложку книги — не поспоришь. На официальном сайте приведены и другие примеры такого "человеческого" подхода:

Fоtо: Kadrs no video
В принципе, можно сказать, что в в этом нет ничего удивительного — в основе функции ImageIdentify, одной из 5 тыс. функций Wolfram, "на-реальный-мир-ориентированного" языка программирования, лежат машинное обучение и нейронные сети. Обучали функцию ImageIdentify на основе других изображений, "расшифровку" которых, конечно же, предлагали люди.

Имеет ли какой-нибудь практический смысл www.imageidentify.com? Для обычных людей сам по себе — нет. Это доказательство того, "как далеко шагнул прогресс", а также забавная игрушка на 10 минут, которой можно "скормить" несколько картинок, посмеяться над результатом, поделиться ими в соцсетях. Но для тех, кто хочет использовать Wolfram как язык программирования, функция ImageIdentify будет полезной. Тем более, что существует API — бери и используй! Подробнее обо всем этом можно прочитать в блоге Стивена Вольфрама.

Отметим, что Вольфрам не является пионером в деле распознавания содержимого изображений. В начале этого месяца Yahoo перезапустила сервис Flickr, встроив в него некий аналог такой же технологии и, тем самым, радикально улучшила качество поиска. Аналоги также есть у Google в виде приложения для Android и у Amazon для iOS и Android. При этом эти программы используют распознавание изображений с чисто утилитарными целями — считать название пылесоса, распознать картину в музее, вот это все. 

И, будучи сделанными корпорациями-монстрами, они "вещи в себе" — ими можно пользоваться, но применить в своем проекте не выйдет. Тогда-то и становится понятно, чем ценно то, что сделал Стивен Вольфрам.

Читайте нас там, где удобно: Facebook Telegram Instagram !