Я попробовал искусственный интеллект Google для преобразования текста в изображение и был шокирован результатами

5 500 руб. 9 167 руб. Buy It Now

Я попробовал искусственный интеллект Google для преобразования текста в изображение и был потрясен результатами

Имаген умеет рисовать лучше меня. (Фото кредиты: Google / Imagen)

Слишком здорово?

Если вы сами проверяли Imagen или другие нейронные сети, то, вероятно, заметили чрезмерную сосредоточенность на нескольких избранных предметах. Например, DALL-E любит создавать образы на основе повседневных предметов, таких как часы или унитазы. imagen, по крайней мере, на данный момент, похоже, ставит милых животных на первое место в своих возможностях по созданию образов. Но на самом деле для этого есть очень веская причина.

Команда Google по работе с мозгом не скрывает, что Imagen остается относительно безвредным. В довольно пространном заявлении команда прекрасно понимает, что нейронные сети могут быть использованы для создания вредного контента, например, расовых стереотипов или продвижения токсичных идеологий. imagen даже использовала набор данных, который, как известно, содержит такой неприемлемый контент.

«Хотя подмножество наших обучающих данных было отфильтровано для удаления шума и нежелательного контента, такого как порнографические изображения и ядовитые выражения, — отметила команда исследователей, — мы также использовали набор данных LAION-400M, который, как известно, содержит широкий спектр неприемлемого контента, включая порнографические изображения, расистские лозунги и вредные социальные стереотипы.

«Imagen полагается на текстовые кодировщики, обученные на несортированных данных веб-масштаба, и поэтому наследует социальные предубеждения и ограничения больших языковых моделей».

Именно поэтому команда Google по работе с мозгом не планирует выпускать Imagen для публичного использования, по крайней мере, до тех пор, пока не будут разработаны дополнительные «меры предосторожности» для предотвращения использования ИИ в неблаговидных целях. В результате предварительный просмотр на сайте ограничен несколькими тщательно отобранными переменными.

В конечном счете, это правильное решение. В прошлом уже были примеры, когда программы искусственного интеллекта выкладывались в открытый доступ в Интернете ……. что дало крайне неудовлетворительные результаты. Возможно, вы помните Tay от Microsoft, аккаунт ИИ в Twitter, который появился на платформах социальных сетей около пяти лет назад.

Tay был довольно смелым экспериментом со стороны Microsoft. Его целью было посмотреть, как ИИ может реагировать и взаимодействовать с реальными людьми в среде социальных сетей. Однако в течение нескольких часов Tay превратился из доброжелательного чатбота в распространителя антисемитской риторики. Согласно заявлению Microsoft, это произошло несмотря на то, что бот был «смоделирован, очищен и отфильтрован» (спасибо The Verge).

Учитывая прецедент, созданный таким ИИ, как Tay, легко понять, почему Imagen держали под контролем. Очевидно, что даже обширной фильтрации может быть недостаточно.

Все еще далеко от совершенства

Хотя Имаген произвел на меня впечатление и я получил массу удовольствия, смешивая и сопоставляя предложения для создания всевозможных странных картин, это определенно не то, что я считаю чрезмерно убедительным. По крайней мере, не в данный момент.

Чаще всего Imagen выдает ужасно смешные результаты. Животные, в частности, часто предстают во всевозможных странных пропорциях. Нередко можно увидеть енота с огромной головой или длинными человекоподобными руками, вцепившимися в руль велосипеда. Хотя это очень интересно, эти странные результаты, смешанные с реалистичными эффектами, часто дают тревожные жуткие результаты.

Вариант производства картин маслом на самом деле является достаточно убедительным, и большая часть того, что Imagen может произвести здесь, не выглядела бы непривычно в школьном проекте. И я имею в виду это в самом хорошем смысле. Персидский кот, играющий на гитаре, оказался гораздо более убедительным на картине, чем на реалистичной фотографии.

Как уже говорилось, скорее всего, в ближайшее время публичный релиз Imagen не появится. Вернее, никогда. Риски, связанные с тем, что программы искусственного интеллекта и нейронные сети могут создавать плохой контент, все еще слишком велики. Пока что, однако, я доволен тем, что Imagen — это забавный антиквариат для тех, кто хочет потратить немного времени на создание комичных изображений животных, катающихся на скейтборде по холмам в ковбойских шляпах.

Размышления

Google Brain's new model Imagen is incredible!

References: ▻Read the full article: https://www.louisbouchard.ai/google-brain-imagen/ ▻Paper: Saharia et al., 2022, Imagen ...

Tags:

We will be happy to hear your thoughts

Добавить комментарий

Technik News
Logo
Enable registration in settings - general