Нейросеть рисует: 5 способов сгенерировать картины онлайн
Сервисы для генерации картинок с помощью искусственного интеллекта набирают популярность: многие видят в них новый источник креатива для дизайна и рекламы. Некоторые приложения бесплатны и доступны всем желающим
Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. РБК Тренды подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).
Содержание:
- DALL-E Mini
- ruDALL-E Kandinsky
- Midjourney
- Starryai
- Dream by WOMBO
DALL-E Mini
Как попробовать:
- зайти на официальный сайт Dall-E Mini через ресурс Hugging Face;
- найти раздел dall-e;
- ввести текстовое описание на английском языке, разделяя слова пробелами;
- нажать Run;
- когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.
Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения, но пока она недоступна широкому кругу пользователей и компаний.
ruDALL-E Kandinsky
Как попробовать ruDALL-E Kandinsky:
- зайти на официальный сайт нейросети;
- выбрать «Попробовать»;
- ввести текстовое описание в окне через пробелы на русском языке;
- ввести код подтверждения;
- скачать готовую картинку или поделиться ею в соцсетях через специальную кнопку.
Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).
Картинка по описанию ruDALL-E Kandinsky
Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе уже есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.
В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. Она доступна в приложении «Салют» от SberDevices и в боте Discord. По словам разработчиков, генерация изображений учитывает точное описание желаемого и создает уникальные изображения, которые раньше не существовали. Их можно использовать для иллюстраций статей, а также в копирайтинге и рекламе.
Midjourney
Как попробовать:
- зарегистрироваться на платформе для геймеров Discord;
- зайти на официальный сайт Midjourney и авторизоваться через Discord;
- перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
- ввести описание на английском языке в плашке Prompt;
- кликнуть «Отправить»;
- появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
- нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.
Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру.
Starryai
Как попробовать:
- перейти на сайт Starryai, кликнуть «Start Creating»;
- пройти верификацию через Google или Apple;
- выбрать опцию Altair или Orion;
- в окне Prompt ввести текстовое описание на английском языке;
- в окне появится картинка, которая будет преобразовываться прямо на глазах;
- кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.
Dream by WOMBO
Как попробовать:
- зайти на сайт Dream;
- в окне Prompt вбить текстовое описание на английском языке;
- выбрать стиль картинки и кликнуть Create;
- нажать Save, также можно повторить попытку генерации, нажав Generate Again.
Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.
В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.
Картинка, сгенерированная Imagen / Google AI
Сначала Google открыла свой сервис для ограниченного бета-тестирования, но теперь оно, похоже, закрыто. Видимо, в ближайшем будущем Imagen станет общедоступным.
6 необычных сервисов, где нейросеть рисует по словам
12.12.2022
Автор: Александр Пономарев
6 сервисов, где нейросети рисуют картинку по описанию
4
5
1
29
Это увлекательно: описываете, что хотите видеть, а нейросеть предлагает вам готовые картинки. Хотите попробовать? Читайте, как это сделать.
Unsplash
Современные технологии развиваются так стремительно, что нейросети, совсем недавно бывшие лишь нелепой забавой, сегодня стали серьезными и эффективными помощниками человека. Причем не только в механической работе, требующей точности в изучении огромного массива данных, но и в творческих задачах. Уже сейчас нейросеть рисует. Нейросеть рисует картины, нейросеть рисует портреты и нейросеть рисует по словам. И нет, это не шутка.
Что такое нейросеть
Прежде чем разбираться с художественными навыками нейросетей, стоит для начала понять, что же это такое — нейронная сеть (она же artificial neural network в английском наименовании). Термин нейросеть своими корнями уходит к исследованиям работы мозга человека и в наши дни применяется к свободно связанному семейству моделей, которые характеризуются большим параметрическим пространством и гибкой структурой. Непонятно? Ничего удивительного, ведь и работа самих нейросетей не самая простая для человека неподготовленного.
Но, кроме шуток, нейросеть работает по принципу человеческого мозга — он состоит из нейронов, которые связаны передающими электрохимические импульсы синапсами — а в нейросети роль нейронов играют вычислительные элементы, которые имитируют мозг человека.
Правда, несмотря на все достижения науки, пока нейросети требуют большого количества технических ресурсов, включая мощнейшие компьютеры, а также не могут соперничать с мозгом человека, где и синапсов больше, и работать они могут параллельно друг с другом. А нейросети пока функционируют лишь через разделение любой, даже самой простой задачи, на череду последовательных шагов к её выполнению. Но уже сейчас нейронные сети способны существенно помогать человеку в повседневных задачах.
Нейросетям доверено распознавать лица в системах видеонаблюдения, диагностировать болезни при анализе данных пациентов, заменять человека в колл-центрах в роли голосовых помощников да даже привычные всем чат-боты тоже используют в своей основе принцип нейронных сетей. Сервисы по имитации голосов и созданию изображений-дипфейков построены также на нейросетях. А в последнее время нейронным сетям доверили даже творческие задачи — написание стихов и рекламных слоганов, сочинение музыки и сценариев для фильмов, разработку и визуализацию промышленного дизайна, а кроме того — превращение слов в изображение.
Крыса-геймер — нейроинженер научил крыс играть в Doom II
DALL-E 2 — нейросеть, которая рисует по словам
В 2021 году одно из детищ Илона Маска, занимающаяся разработкой и лицензированием технологий на основе машинного обучения американская компания OpenAI, представила нейросеть DALL-E, способную создавать изображение по его текстовому описанию. Опыт был признан удачным и в 2022 году анонсировали DALL-E 2 — дальнейшее развитие своего прародителя.
К основным особенностям нейросети добавилось в четыре раза более высокое качество итоговых изображений, возможность редактировать загруженные фотографии (удалять или добавлять объекты на готовое изображение) и создавать третье изображение на основе двух загруженных, сочетая в получившемся новом характерные черты стиля исходных иллюстраций.
На старте DALL-E 2 (названа, если кто не догадался, в честь испанского художника-сюрреалиста Сальвадора Дали) находилась в закрытом бета-тесте и доступа всех желающих к ней не было предусмотрено. Но по окончании испытаний на основе нейросети все желающие могут создавать собственные приложения для обработки и создания изображений. Или пользоваться возможностями проекта.
На официальном сайте нейросети необходимо завести персональный аккаунт, а затем потратить свой баланс «кредитов» на создание изображений — бесплатно доступно 50 кредитов, а со второго месяца их лимит сокращается до 15 кредитов. Если этого вам недостаточно, кредиты можно купить (но у владельцев карт российских банков с этим могут быть сложности), а дальше тратить их на то, чтобы заданные вами текстовые описания превращались в иллюстрации.
GLIDE — нейросеть для рисования
Все та же OpenAI представила в 2021 году нейросеть GLIDE, которая способна обрабатывать загруженные изображения, а также генерировать уникальные иллюстрации на основе их текстового описания. С помощью сервиса можно добавлять на изображения различные элементы, причем GLIDE может работать не только с фотографиями, но и рисунками — в обоих случаях нейронная сеть «считывает» стиль исходной иллюстрации, что позволяет гармонично вписывать новый объект, адаптируя его под общий стиль изображения.
По качеству своей работы новая нейросеть превосходит DALL-E и даже может качественно справляться с необычными заданиями, но и как любая нейросеть периодически GLIDE способна дать сбой при выполнении самого простого запроса. Описание своего проекта разработчики из OpenAI представили в виде научной публикации на портале arXiv.org, а также выложили на GitHub исходный код сокращенной версии нейросети для тестов всеми заинтересовавшимися проектом.
Так что если вы захотите воспользоваться наработками команды инженеров OpenAI, то придется скачать опубликованный ими код и самостоятельно организовать на своих мощностях собственную нейросеть. Если возможности такой нет, то придется воспользоваться другими вариантами сервисов из нашей подборки.
GauGAN 2 — нейросеть, которая рисует картинку по запросу
Еще один американский технологический гигант — компания Nvidia — который специализируется на разработке графических процессоров и систем на чипе снискал себе славу в индустрии видеоигр, сфере профессиональной визуализации, областях высокопроизводительных вычислений и беспилотных автомобилях, которые используют бортовые компьютеры Nvidia, также не остался в стороне от нейросетей. В 2019 году появилась нейронная сеть GauGAN, генерирующая изображения на основе эскизов, а под конец 2021 года создали GauGAN 2.
Основной фишкой GauGAN 2 (имя ей дал французский постимпрессионист Поль Гоген) стало умение создавать иллюстрации на основе текстовых описаний. Для обучения использовался суперкомпьютер NVIDIA Selene, десятки миллионов высококачественных изображений и текстов, на основе которых нейросеть тренировалась устанавливать связь между словами и иллюстрациями, стилем текста и готовым изображением.
В демонстрационном режиме GauGAN 2 доступна на сайте компании-разработчика, а вот первую версию своей нейросети Nvidia воплотила в релизном продукте — алгоритмы нейронной сети работают с изображениями в редакторе Canvas, воспользоваться которым можно на официальном сайте проекта.
Художник и нейросеть показали, как выглядели бы исторические личности сегодня — Наполеон, Джордж Вашингтон, Моцарт и другие
ruDALL-E — нейросеть, которая рисует онлайн
Особняком среди всех проектов стоит труд команды SberDevices и Sber AI при содействии SberCloud, которая взяла за основу модель DALL-E от компании OpenAI, а затем перевела ее на русский язык. Российские специалисты взяли код, запустили обучение нейросети на платформе ML Space на базе суперкомпьютера «Кристофари» — 23 тысячи GPU-часов обучения на массиве данных из 120 миллионов пар текст-изображение обернулись самым большим нейросетевым вычислительным проектом в России и СНГ и нейросетью ruDALL-E. Это единственная в мире нейронная сеть, которая может генерировать изображения на основе текстового описания на русском языке (позднее, впрочем, вышла версия для работы с англоязычными описаниями).
Как описывает свой проект «Сбер», ruDALL-E создает новое изображение по пользовательскому описанию в три стадии. Первой является использование отдельной нейросети, которая превращает указанный текст в некое заданное системой количество картинок. Потом включается в работу вторая нейросеть, которая уже на основе своих алгоритмов отбирает самые удачные иллюстрации с учетом не только их качества изображения, но и максимального соответствия пользовательскому запросу. На выходе третья нейросеть берет появившиеся на предыдущем шаге работы ruDALL-E картинки и обрабатывает их с тем, чтобы обеспечить им максимальное качество при максимальном же размере изображения. Разработчики обещают, что их детище генерирует неограниченно большое количество изображений по указанному пользователем запросу, поскольку нейросети с каждым таким запросом обучаются и на текстовых командах, и на сгенерированных алгоритмами изображениях. При этом платформа использует ruDALL-E XL, содержащую 1,3 миллиарда параметров, и ruDALL-E 12B с 12 миллиардами параметров.
Уменьшенный вариант ruDALL-E доступен в приложении «Салют» и на демосайте, а на устройствах Sber или в приложении «Салют» для запуска нейросети достаточно голосовой команды «Открой Дали» или «Запусти художника».
DALL·E mini — нейросеть рисует портреты
Упрощенный вариант нейросети для создания иллюстраций по их текстовому описанию от компании Илона Маска. Основное отличие от проекта DALL-E 2 заключается в том, что эта нейросеть генерирует изображения в открытом доступе и воспользоваться ею может любой желающий, причем совершенно бесплатно.
Минусов, учитывая бесплатность и общедоступность нейросети, тоже хватает. Во-первых, официальный сайт сервиса не всегда работает из-за наплыва трафика. Во-вторых, время ожидания готового результата (достаточно просто ввести описание желаемой иллюстрации на английском языке и нажать кнопку Draw) может составлять десятки минут. В-третьих, сохранить можно изображение только в не самом высоком качестве. Зато на выходе по одному запросу нейросеть позволяет получить сразу девять иллюстраций.
Dream by Wombo — нейросеть рисует картины по словам
По своим возможностям нейросеть от канадского стартапа похожа на DALL·E mini, но отличия все-таки есть. К схожим чертам можно отнести предельно простой интерфейс — на сайте достаточно указать описание (но только на английском языке и описание должно укладываться в 200 символов) и кликнуть по клавише Create, чтобы получить иллюстрацию. В остальном — различия.
Dream by Wombo специализируется только на вертикальных иллюстрациях и это важно иметь ввиду перед началом работы. Зато нейросеть позволяет выбрать стиль готового изображения из предложенных на сайте вариантов (или отказаться от этого и довериться «вкусу» платформы), а при желании и вовсе можно прикрепить референсную картинку, чтобы попытаться получить на выходе похожую иллюстрацию. Если не выйдет — можно тут же «перегенерировать» получившееся изображение. Зато все бесплатно.
P.S. Иллюстрации в разделах о нейросетях GauGAN 2, ruDALL-E, DALL·E mini и Dream by Wombo показывают то, как нейронные сети Nvidia и «Сбера» представляют себе слово iChip — в большинстве случаев название нашего издания вызывает у нейросетей космические «ассоциации».
Еще одно модное словечко, которое теперь у всех на слуху — NFT. Почитайте в нашей статье, что это такое и как на этом можно заработать.
Теги онлайн-сервисы нейросети нейронная сеть
Автор
Александр Пономарев
Редактор
Была ли статья интересна?
Поделиться ссылкой
Нажимая на кнопку «Подписаться»,
Вы даете согласие на обработку персональных данных
Рекомендуем
Обзор планшета HONOR Pad 8: большой экран и 8 динамиков
Обзор умных колонок SberBoom и SberBoom Mini
Топ-5 игр из AppGallery в 2022 году
Во сколько пойдет дождь и когда сажать рододендрон: необычные прогнозы Яндекс Погоды
Обзор лазерного МФУ «три в одном» для дома и офиса HIPER M-1005
Обзор смартфона HONOR X9a: как флагман, но доступнее
Обзор беспроводных наушников OneOdio Focus A10
Не станком единым: выбираем лучшую электробритву
Обзор realme 10 Pro 5G и 10 Pro+ 5G: мощные премьеры
Реклама на CHIP Контакты
Программа для рисования — Рисование диаграмм и графиков онлайн
Изготовление рисунков и графики всех видов
Начать сейчасРозыгрыш онлайн
SmartDraw — самый простой способ рисования. Это так просто, что почти рисует для вас диаграммы.
Попробуйте сами. Нажмите «Пуск» выше, выберите шаблон, введите свою информацию, а SmartDraw сделает все остальное. Он автоматически выравнивает все и помогает применять профессиональные темы дизайна. Каждый раз вы получаете великолепные результаты.
Рисуй что угодно легко
SmartDraw поможет вам:
- Нарисовать идеи в форме на интеллект-карте
- Нарисуйте процесс с помощью блок-схемы
- Разработка проектов реконструкции в виде планов этажей и ландшафтных дизайнов
- Нарисовать карту
- Нарисуйте структуру вашей организации в виде организационной диаграммы
- Рисование научных иллюстраций, таких как клетки, астрономические диаграммы, медицинские графики
- Рисование пользовательских символов, значков и рисунков
- Нарисуйте маркетинговый визуальный элемент, например инфографику или слайд презентации
Почему SmartDraw — лучшая программа для рисования
- Интеллектуальное форматирование
Только SmartDraw предлагает интеллектуальное форматирование с помощью сочетаний клавиш и простых команд, которые рисуют диаграммы за вас. Когда вы добавляете, перемещаете или удаляете фигуры, SmartDraw автоматически корректирует и выравнивает ваш рисунок. Это рисование без головной боли. - Шаблоны для быстрого старта
Сотни профессионально разработанных шаблонов рисунков сводят к минимуму количество времени, которое вы на самом деле тратите на рисование. Просто выберите шаблон, наиболее похожий на ваш проект, и настройте его в соответствии с вашими потребностями. - Бесплатная поддержка
Есть вопрос? Позвоните или напишите нам. Специалисты SmartDraw готовы помочь бесплатно!
Легкое сотрудничество
Вы и ваша команда можете работать над одним и тем же рисунком, сохранив его в общую папку SmartDraw или используя ваши любимые приложения для обмена файлами, такие как Dropbox ® , Google Drive ™ , Box ® или OneDrive ® . Вы также можете обмениваться файлами с пользователями, не являющимися пользователями SmartDraw, просто отправив им ссылку по электронной почте.
Интеллектуальная интеграция
Преимущество SmartDraw в том, что вы можете создавать и редактировать диаграммы на своем компьютере, в браузере или на мобильном устройстве — Windows ® , Mac ® , Android ® , iOS ® или любая другая платформа с подключением к Интернету. Находитесь ли вы в офисе или в пути, вы получите полный набор функций, символов и высококачественную продукцию, которую вы получаете только с помощью SmartDraw.
Когда ваш рисунок будет готов, вы можете отправить его коллегам по электронной почте, используя простую ссылку. Вы также можете поделиться своим рисунком в различных распространенных графических форматах, таких как PDF или PNG. Вы также можете вставить его в любой Office ® или приложение Google Workspace ™ всего за несколько простых кликов. SmartDraw для рабочего стола Windows также работает в вашей сети Sharepoint.
Попробуйте SmartDraw бесплатно
Эта программа ИИ может рисовать впечатляющие изображения всего, что вы ей скажете
Новая программа ИИ поразила публику своей способностью рисовать реалистичные и креативные изображения из простого текстового описания.
Программа называется DALL-E 2 и разработана исследовательской лабораторией OpenAI в Сан-Франциско. В среду лаборатория представила ИИ, продемонстрировав(открывается в новом окне) искусство, которое он может создавать.
Результаты впечатляют и заставляют задуматься, а не за этим ли будущее редактирования изображений. Например, если вы скажете ИИ нарисовать «коалу, бросающую мяч в мяч», DALL-E 2 сделает именно это, создав фотореалистичное изображение животного, летящего по воздуху к баскетбольному кольцу.
(Открытый ИИ)
ИИ также может редактировать существующие фотографии, заменяя изображения внутри. Например, если вы наберете «милый кот» для фотографии собаки, DALL-E 2 превратит собаку в котенка.
Кроме того, программа может просматривать исходное изображение и создавать его различные вариации в одном стиле.
OpenAI создал DALL-E 2, запрограммировав ИИ для изучения существующих изображений, которые были помечены текстовым описанием, поясняющим изображенного человека, животное или предметы. Благодаря обучению «глубокому обучению» DALL-E 2 может не только распознавать, что находится внутри изображения, но и пытаться воспроизвести его.
OpenAI представила первую версию(Открывается в новом окне) DALL-E еще в январе 2021 года. Однако вторая версия была обновлена, чтобы отрисовывать изображения более точно и с художественным качеством более высокого разрешения.
(Открытый ИИ)
Также важно отметить, что DALL-E 2 может рисовать вещи, которые технически не существуют в реальном мире. Например, если вы скажете ему нарисовать «обезьяну, платящую налоги», ИИ достаточно умен, чтобы сгенерировать животное лицом к компьютеру, даже если он никогда не сталкивался с таким изображением в процессе обучения.
Генеральный директор OpenAI Сэм Альтман сказал, что DALL-E 2 представляет собой предварительный просмотр того, что искусственный интеллект будущего приготовит для вычислений.
Твитнуть(откроется в новом окне)
«Это еще один пример того, что, как мне кажется, станет новой тенденцией компьютерного интерфейса: вы говорите, что хотите, на естественном языке или с контекстуальными подсказками, а компьютер делает это», — написал он в своем блоге (Opens in a новое окно). «Мы можем представить себе «офисного работника с искусственным интеллектом», который принимает запросы на естественном языке, как это делает человек».
Рекомендовано нашей редакцией
Джеймс Кэмерон: Скайнет уничтожит человечество с помощью дипфейков, а не ядерного оружия
Facebook: использование ИИ ярлыка «приматы» на видео чернокожих было «неприемлемым»
Искусственный интеллект, который находит родственную душу: сколько бы вы заплатили?
DALL-E 2 также показывает, что искусственный интеллект способен на творческую работу, а не только на автоматизацию. Однако Альтман сказал: «Несмотря на то, что преимущества велики, модель достаточно мощная, чтобы легко представить ее недостатки».
Альтман в минусы не вдавался. Но прошлые исследования и демонстрации показали, что дипфейки людей, созданные искусственным интеллектом, можно использовать для распространения пропаганды и введения в заблуждение общественности.
Альтман добавил: «Надеюсь, этим летом мы запустим продукт, и люди смогут использовать его для самых разных целей. Мы хотели начать с запуска исследования, чтобы выяснить, как свести к минимуму недостатки в сотрудничестве с большей группой исследователей и художников, и дать людям время адаптироваться к изменениям».
Компания OpenAI опубликовала исследовательскую работу(Открывается в новом окне) с дополнительной информацией о разработке DALL-E 2. Он также создал учетную запись Instagram (открывается в новом окне), в которой представлены произведения искусства, созданные DALL-E 2.
Получите наши лучшие истории!
Подпишитесь на What’s New Now , чтобы каждое утро получать наши главные новости на ваш почтовый ящик.
Этот информационный бюллетень может содержать рекламу, предложения или партнерские ссылки. Подписка на информационный бюллетень означает ваше согласие с нашими Условиями использования и Политикой конфиденциальности. Вы можете отказаться от подписки на информационные бюллетени в любое время.
Спасибо за регистрацию!
Ваша подписка подтверждена.