Google теперь распознаёт рисунки, нейросеть улучшена

Google теперь распознаёт рисунки, нейросеть улучшена

Как пишет TJ, Quick, Draw! построена на базе нейросети, которую компания использует в сервисе онлайн-перевода для распознавания рукописного текста на различных языках. В данном случае задача алгоритма состоит в том, чтобы быстро угадать заданный объект по простому рисунку.

В ходе отдельного раунда игра просит пользователя нарисовать шесть различных объектов (например, пальму, грузовик или кофейную чашку). На создание каждого рисунка отводится не более 20 секунд, а в процессе рисования нейросеть пытается отгадать, что именно рисует пользователь. Если искусственный интеллект досрочно угадывает объект, то игра предлагает следующее задание.

По завершении раунда Quick, Draw! добавляет рисунки пользователя в базу данных, а также подробно разбирает каждый из них, показывая игроку, на что его рисунок был похож и как тот же самый объект рисовали другие люди.

Разработчики игры отмечают, что распознавание простого рисунка выглядит очень простым для человека, однако для алгоритма эта задача является гораздо более сложной. Например, кошку можно изобразить самыми разными способами: целиком, голову или только мордочку.

Для облегчения распознавания рисунков нейросеть учитывает не только форму изображения, но и последовательность нанесения элементов. Так, в примере с кошкой многие пользователи первым делом изображают характерный контур головы, а после добавляют прочие детали.

Отметим, что помимо Quick, Draw! Google запустила еще несколько приложений, использующих в работе нейросети, в рамках проекта A.I. Experiments. Так, приложение Giorgio Cam способно «сочинить» песню из названий предметов, попадающих в поле зрения камеры смартфона, а сервис Thing Translator переводит их названия на разные языки.