Карта сайта со всеми инструментами для фото обработки

Для большинства нижеперечисленных онлайн инструментов на этом сайте максимальный размер загружаемого файла составляет 35-128 Мб, этого вполне достаточно даже для профессиональных фотографий размером около 100 мегапикселей. Все изображения после обработки хранятся не более 2-х часов. Это не файловый хостинг, а бесплатный сервис для качественной обработки фотографий онлайн. Если при обработке картинки на этом сайте вам помешает ограничение размера в мегабайтах или в мегапикселях, то пишите на контактный e-mail, приложив к письму саму картинку и описание нужных вам настроек – будет сделано бесплатно в течение суток.


Сжатие и изменение размера:
Изменить размер в: пикселях | см, мм, дюймах | мегапикселях | процентах
Обрезка, кадрирование
Сжать JPG-файл, указав: уровень качества | размер в Кб, Мб


Обработка встроенных метаданных:
Копировать EXIF, IPTC, XMP метаданные
Получить подробную EXIF информацию
Редактировать EXIF, IPTC, XMP теги в JPEG файле
Удалить все метаданные


Эффекты:
3D вращение
8-битная картинка
GIF-анимация для сравнения
GIF-анимация из 2-х картинок
GIF-анимация из частей картинки
HDR обработка
Абстракция из штрихов и точек
Бесконечность, рекурсия
Винтаж
Виньетирование
Водоворот
Волны от дождя
Выделить цвет на чёрно-белом фоне
Выпуклость или вогнутость
Газетная печать
Гравюра
Двоение
Дизеринг чёрно-белый
Дизеринг, ограничение количества цветов
Дросте, бесконечная спираль
Живопись
Заменить цвет
Зарисовка
Зеркальное отражение
Зеркальное отражение под фотографией
Зеркальные отражения из половинок
Зеркальный коллаж
Зум, приближение
Извлечь цветовой канал
Иллюстрация
Искажение
Калейдоскоп
Капли воды
Картинка из: кругов друг на друге, кругов рядом друг от друга, звёзд, квадратов, размытых кружков, треугольников
Кинескопные субпиксели
Космический свет
Линейная абстракция
Ломография
Масляная картина
Масляные мазки
Медианный фильтр
Мозаика: из домино, из множества фотографий, из разных элементов, минеральная, министек
Монохром
Мультяшная картинка
Мягкий свет
Наклон или сдвиг
Наложить клипарты
Наложить одну картинку на другую
Наложить разноцветные квадраты
Негатив
Нейросетевой эффект
Новелла
Ночное видение
Огненная картинка
Падающий снег
Пазлы
Перемешать картинку
Пикселизация: обычная, треугольная, шестиугольная
Пиксельная картинка в клеточку
Пиксельный фон
Плазма
Плакат Хоуп (Hope)
Пластиковая картинка
Пластиковый градиет
Плетёнка
Плёночный снимок
Полароидная фотография
Полигональная картинка
Постеризация
Почтовая марка
Радиальные волны
Размытие: обычное, линейное, круговое, радиальное
Размытый фон: двухцветный, разноцветный
Рамка: для картины, зеркальная, зимняя, из основных цветов, полосатая или сетчатая, размытая, разноцветная
Рисунок: простым карандашом, цветными карандашами, мелом, углём
Рифлёное стекло
Рябь на воде
Световые пятна
Свечение или сияние
Сепия
Сказочная картинка
Софт-фокус
Сферическая панорама
Тень под фото
Тепловизор
Тетрис
Тилт-Шифт
Топографическая карта
Трафарет: чёрно-белый и цветной
Трещины
Тёмная сказочная картинка
Утечка света, блики
Фильтр Байера
Фрактал
Холст
Хроматические аберрации
Цветная плитка
Цветовой фильтр: двухтональный, матовый, однотонный, цветной
Чередование двух картинок
Чёрно-белое фото
Шахматная доска
Энди Уорхол
Эффект Боке
Эффект Ортона


Улучшения:
Авто контраст
Авто обогащение
Авто уровни
Автоматическая гамма-коррекция
Автоматический цветовой баланс
Коррекция фото под водой
Насыщенность, светимость и тон
Негатив в позитив
Нормализация
Осветление
Повернуть на 45°, 90°, 180°
Резкость, нарезная маска
Ретуширование
Температура цвета, баланс белого
Тени и свет
Увеличить фото
Улучшить отсканированный текст
Устранить JPEG артефакты и пикселизацию
Цветовой баланс
Шумопонижение
Яркость и контрастность


Инструменты:
3D картинка
3D картинка в 2D
Favicon. ico для сайта
GIF-анимация из 2-30 картинок
PDF и DjVu страницы в JPG изображения
Бесшовная текстура
Заменить белый или однотонный фон на прозрачный
Изменить размер в сантиметрах
Изменить текстуру
Календарь 2018 с фото
Коллаж
Конвертер цветов
Мотиватор или демотиватор
Найти отличия
Наложить сетку
Наложить текст на фото
Объединить две картинки
Определить основные цвета картинки
Определить уровень сжатия JPG
Палитра цветов
Плитка или проверка бесшовности текстуры
Проверить, прогрессивный ли JPEG
Процент похожести
Разрезать фото
Распознать QR-код, Штрихкод, DataMatrix
Распознать текст (OCR)
Сайт в PDF
Сделать JPG прогрессивным
Сделать фото в форме ♥ ▲ разных геометрических фигур
Скриншот сайта
Смешать цвета
Создать QR-код
Узнать количество уникальных цветов
Узнать размер в мегапикселях



Дальше – больше разных онлайн инструментов для обработки картинок и фотографий.

Масштабируемая картинка на фоне сайта / Хабр

Tvarb

Время на прочтение 4 мин

Количество просмотров

20K

Разработка веб-сайтов *

Задача:
Дизайнер нарисовал макет страницы, на заднем фоне которой была картинка. Я сначала было решил, что это фон который увеличивается по ширине в зависимости о разрешения монитора.
Но не тут то было. Дизайнер настаивал на то, что это масштабируемая картинка, которая сужается / растягивается при изменение окна приложения и по ширине и по высоте.
Заранее предупредив заказчика – что картинка будет грузиться 1 и в максимальном разрешении – его определили как 1600, приступил к работе.

Теория:
Для реализации данной функциональности, нам необходимо будет поиграться с абсолютным позиционирование

м. Так как фон масштабировать мы не можем – придется положить на нижний слой изображение которое будет пропорционально масштабироваться, а сверху нее уже положиться сетку сайта.

Схематическое представление приведено на рисунке.

Практика

HTML:

<div><br>  <div><br>    Меню<br>    <br>  </div><br>  <div><br>    Контент<br>  </div><br></div><br><br><div><br>  <div><br>    <ul><br>      <li><a href="#" title="О компании">О компании</a></li><br>      <li><a href="#" title="Контакты">Контакты</a></li><br>    </ul><br>    <div><br>      <span>Copyright; © 2009</span><br>    </div><br>  </div><br><!--Растягивающаяся картинка--><br>  <div><img src="img/back_001.
jpg" alt="" title="" /></div><br></div><br><br>* This source code was highlighted with Source Code Highlighter.

CSS:

  1. html {
  2. height:100%;
  3. }
  4.  
  5. body {
  6. margin: 0; padding: 0;
  7. height: 100%;
  8. }
  9.  
  10. a {
  11. outline:none;
  12. }
  13.  
  14. /*Обертка картинки*/
  15. #main {
  16. position: relative;
  17. z-index: 1;
  18. height:100%;
  19. }
  20. /*Сам слой с картиной*/
  21. #main div.img {
  22. display: block;
  23. position: absolute;
  24. bottom:0; /*картинка всегда будет находиться внизу страницы*/
  25. z-index: 10;
  26. min-width: 1000px;
  27. width: 100%;
  28.    _width: expression((documentElement. clientWidth||document.body.clientWidth)<1004?’1004px’:’100%’);
  29. }
  30.  
  31.  

  1. /*Слой с копирайтами и нижнее меню*/
  2. #main div.foot {
  3. position: absolute;
  4. bottom: 80px;
  5. z-index: 20;
  6. width:100%;
  7. height: 30px;
  8. min-width: 1000px;
  9. _width: expression((documentElement.clientWidth||document.body.clientWidth)<1004?’1004px’:’100%’);
  10. }
  11.  
  12. #main div.foot ul {
  13. list-style:none;
  14. font: normal 12px Verdana;
  15. margin: 14px 0 0 75px;
  16. padding: 0;
  17. }
  18. #main div.foot ul li {
  19. display: inline;
  20. margin: 0 120px 0 0;
  21. }
  22.  
  23. #main div.foot ul li a, #main div.foot ul li a:visited {color: #faffcd;}
  24. #main div. foot ul li a:hover {color:#163133;}
  25.  
  26. #main div.contacts {
  27. position:absolute;
  28. right: 44px; top: 14px;
  29. width: 360px;
  30. font: normal 11px Verdana;
  31. color: #faffcf;
  32. }
  33. /*Cам сайт*/
  34.  
  35. #page {
  36. position: absolute;
  37. top: 0; left: 0;
  38. z-index: 30;
  39. width: 100%;
  40. overflow: hidden;
  41. margin: 0 0 300px 0;
  42. min-width: 1000px;
  43. _width: expression((documentElement.clientWidth||document.body.clientWidth)<1004?’1004px’:’100%’);
  44. }
  45.  
  46. #left {
  47. width:290px;
  48. float: left;
  49. }
  50.  
  51.  
  52. #right {
  53. margin:0 48px 0 370px;
  54. position: relative;
  55. color: #4c4f51;
  56. font: normal 12px/18px Verdana;
  57. }
  58.  

Использовать либо xaк для ie6 «_», либо conditional comments — это дело вкуса. <br / >Просьба не устраивать холиваров 🙂

Все вроде бы хорошо, но нам установить высоту блока обертки картинки (div id=«main») равной = высоты слоя с данными div id=«page» + 400px — высота отсупа от картинки, в противном случае у нас контент сайта и картинка будут жить отдельными жизнями. Для данной цели мы задействуем JS, который мы повесим на onload

JS

  1. <script language=»javascript»>
  2. function test(){
  3. var h = 400 + document.getElementById(‘page’).offsetHeight;
  4. if (h > 600) { 
  5. document.getElementById(‘main’).style.height = h + ‘px’;
  6. }
  7. }
  8. </script>

Пример
Из за баннера хостинга в FF белая полоса 🙂 в IE все путем

Bug Fix
Забыл про большие мониторы для этого вычисляем высоту окна

    function test(){<br>      var client = document. compatMode=='CSS1Compat' && !window.opera?document.documentElement.clientHeight:document.body.clientHeight; ;<br>      var h = 270 + document.getElementById('page').offsetHeight;<br>      if (h > client) { <br>        document.getElementById('main').style.height = h + 'px';<br>      }<br>    }<br><br>* This source code was highlighted with Source Code Highlighter.

Изменение в CSS

<br>#main {<br>  position: absolute;<br>  top:0; left:0; right:0; bottom:0;<br>  z-index: 1;<br>  height:100%;<br>}<br><br>* This source code was highlighted with Source Code Highlighter.

Буду рад, если кому-то пригодится.

Теги:

  • масштабируемая картика
  • html
  • css. js

Хабы:

  • Разработка веб-сайтов

Всего голосов 69: ↑53 и ↓16 +37

Комментарии 50

Дмитрий @Tvarb

Пользователь

Комментарии Комментарии 50

Природный и культурный заповедник Picture Canyon

Природный и культурный заповедник Picture Canyon — это природная и культурная достопримечательность, расположенная на северо-востоке Флагстаффа, по адресу 3920 N El Paso Flagstaff Rd. Помимо значительных петроглифов Северного Синагуа и других культурных ресурсов, соглашение с близлежащей станцией очистки сточных вод Уайлдкэт-Хилл обеспечивает круглогодичный источник воды, обеспечивающий важнейшую прибрежную среду обитания для диких животных и певчих птиц.

Город Флагстафф приобрел заповедник площадью 478 акров у Земельного департамента штата Аризона в 2012 году при финансовой поддержке одобренной избирателями в 2004 году облигации Open Space и гранта Growing Smarter от парков штата Аризона. Приобретение Picture Canyon предоставляет членам сообщества Флагстаффа естественную возможность узнать об экологии, геологии и археологии, участвуя в отдыхе на природе.

Ознакомьтесь с нашей брошюрой (PDF), картой маршрута (PDF) и самостоятельным туром по Каньону Картин, чтобы узнать больше о ресурсах заповедника и системе маршрутов. Просмотр изображений из природного и культурного заповедника Picture Canyon. Дополнительная информация об истории Picture Canyon (PDF).

Журнал «Плато»

В 2014–2015 годах Музей Северной Аризоны издал прекрасный журнал «Плато», в котором представлены фотографии людей каньона, петроглифов и места, включая сведения об экологии, археологии и истории заповедника (том 8). , № 1 и 2). К сожалению, этот выпуск больше не издается, но вы можете приобрести его в книжном магазине Музея или в Интернете.

Как добраться

Адрес: 3920 N El Paso Flagstaff Rd во Флагстаффе, Аризона. С I-40:

  • Съезд 201 (Hwy 89 N Page, Country Club). Если едете с запада, поверните налево на бульвар Country Club; если едете с востока, поверните направо на Country Club Boulevard
  • На пересечении с US 180/US 89 поверните налево
  • На следующем светофоре поверните налево на W Historic Route 66
  • Через 1,8 мили поверните налево на Эль-Пасо Флагстафф Роуд
  • Вы увидите знак станции очистки воды Wildcat. Оставайтесь на этой дороге, которая поворачивает направо вокруг территории завода по очистке воды. Парковка находится в конце дороги справа.

Из Уолнат-Каньона следуйте по Уолнат-Каньон-роуд/Старому маршруту 66 на запад, обратно в сторону Флагстаффа. Через 5,8 мили поверните направо на Эль-Пасо-Флагстафф-роуд.

Отдых

Природный и культурный заповедник Picture Canyon — прекрасное место для пеших прогулок, катания на горных велосипедах, верховой езды, фотографирования окружающей среды, наблюдения за дикой природой, знакомства с осенними красками и открытия культурных ресурсов, включая петроглифы.

Заповедник бесплатный и открыт для публики круглый год. В начале тропы есть переносной туалет, но нет урны для мусора, так что, пожалуйста, «упакуйте его, упакуйте!»

Пикчер-Каньон определен как место наблюдения за дикой природой в Аризоне и как парк Одюбон в северной части штата Аризона, учитывая количество млекопитающих и птиц, которые называют Пикчер-Каньон своим домом.

Пожалуйста, соблюдайте этикет посещения культурных объектов, а также законы штата и федеральные законы. Не портите 1000-летние руины или петроглифы и не вывозите артефакты из заповедника.

Чтобы узнать больше о растениях, найденных в заповеднике, просмотрите наш список растений (PDF). Вы можете загрузить карту системы троп с географической привязкой на свой смартфон.

Информация о трассе

Название тропы Расстояние Важная информация
DON WEAV Игнорировать. Некоторое изменение высоты потребовало подъема из каньона.
Петля Тома Муди 4,8 мили Внешняя петля вокруг всего заповедника, включая основное местонахождение петроглифов «Водяная птица». Относительно ровная трасса.
Аризонская тропа
(в пределах заповедника)
1,5 мили Участок тропы протяженностью более 800 миль, соединяющей Мексику и Юту. Тропа легко различима, и на этом участке мало перепадов высот.

Предстоящие события

Среда Сбор сорняков будет возобновляться каждую вторую среду с 24 мая по 13 сентября 2023 года. Обратите внимание на вечернее время. Мы встретимся в начале тропы. Носите длинные брюки и одежду с длинными рукавами, возьмите с собой шляпу от солнца, рабочие перчатки, солнцезащитный крем, воду и лопату для сорняков, если она у вас есть, но у нас будут дополнительные услуги!

24 мая 2023 г. 7–10 утра, 7 июня 2023 г. 17–20 часов, 21 июня 2023 г. 7–10 утра, 5 июля 2023 г. 17–20 часов, 19 июля 2023 г. 7–10 утра

2 августа 2023 г. ,   16 августа 2023 г. 7–10 утра,   30 августа 2023 г. 7–10 утра,    13 сентября 2023 г. 17–19:30

Бюро находок

Если вы что-то потеряли в Picture Canyon, возможно, мы это нашли! Напишите Сильвии Струсс по электронной почте или позвоните по телефону 928-213-2328.

Правила

Охота, рыбалка, рубка леса или моторизованные транспортные средства запрещены на территории заповедника. Не взбирайтесь на стены каньона и не плавайте в Рио-де-Флаг. «Упакуйте это, упакуйте это». Пожалуйста, пожалуйста, ПОЖАЛУЙСТА, берегите петроглифы — не царапайте валуны и не лезьте на них. .. Их создали предки коренных американцев, и они священны. Спасибо!

Imagen: Модели распространения текста в изображение

Imagen: Модели распространения текста в изображение

беспрецедентный фотореализм × глубокий уровень понимания языка

беспрецедентный фотореализм

глубокий уровень понимания языка

Исследование Google, команда Brain Team

Мы представляем Imagen, модель распространения текста в изображение с беспрецедентной степенью фотореализма и глубоким уровнем понимания языка. Imagen опирается на мощь больших языковых моделей преобразования в понимании текста и опирается на силу моделей диффузии в высокоточном создании изображений. Наше ключевое открытие состоит в том, что универсальные большие языковые модели (например, T5), предварительно обученные на текстовых корпусах, удивительно эффективны. эффективен при кодировании текста для синтеза изображений: увеличение размера языковой модели в Imagen повышает как точность выборки, так и текст изображения выравнивание гораздо больше, чем увеличение размера модели рассеяния изображения.

Imagen достигает нового современного балла FID 7,27 в наборе данных COCO, даже не обучаясь на COCO, и люди-оценщики считают, что образцы Imagen находятся на одном уровне с самими данными COCO в выравнивании изображения и текста. Для более глубокой оценки моделей преобразования текста в изображение мы представляем DrawBench, всеобъемлющий и сложный эталонный тест для моделей преобразования текста в изображение. С помощью DrawBench мы сравниваем Imagen с последними методами, включая VQ-GAN+CLIP, модели скрытой диффузии и DALL-E 2, и обнаруживаем, что оценщики-люди предпочитают Imagen другим моделям в параллельных сравнениях, как с точки зрения качества выборки и выравнивание изображения и текста.

Еще от семьи Imagen:

Мозг едет на ракетном корабле, направляющемся к Луне. Мозг едет на ракетном корабле, направляющемся к Луне. Драконий фрукт в поясе для карате в снегу. Драконий фрукт в поясе для карате в снегу. Маленький кактус в соломенной шляпе и неоновых солнцезащитных очках в пустыне Сахара. Маленький кактус в соломенной шляпе и неоновых солнцезащитных очках в пустыне Сахара. Фотография собаки корги на велосипеде на Таймс-сквер. На нем солнцезащитные очки и пляжная шляпа. Фотография собаки корги, едущей на велосипеде на Таймс-сквер. На нем солнцезащитные очки и пляжная шляпа. Плюшевые мишки плавают на Олимпийских играх в беге баттерфляем на 400 м. Плюшевые мишки плавают на Олимпийских играх в беге на 400 м баттерфляем. текст «Imagen», выходящий из книги сказок. Прозрачная скульптура утки из стекла. Скульптура находится перед картиной пейзажа. Прозрачная скульптура утки из стекла. Скульптура стоит перед картиной с пейзажем. Единственный луч света входит в комнату с потолка. Луч света освещает мольберт. На мольберте картина Рембрандта с изображением енота. Единственный луч света входит в комнату с потолка. Луч света освещает мольберт. На мольберте картина Рембрандта с изображением енота.

Визуализация Imagen. Imagen использует большой замороженный кодировщик T5-XXL для кодирования входного текста во встраивание. Модель условной диффузии отображает встраивание текста в изображение размером 64×64. Imagen также использует текстовые модели диффузии сверхвысокого разрешения для увеличения разрешения изображения до 64×64→256×256 и 256×256→1024×1024.

  • Мы показываем, что большие предварительно обученные кодировщики замороженного текста очень эффективны для задачи преобразования текста в изображение.
  • Мы показываем, что масштабирование размера предварительно обученного кодировщика текста более важно, чем масштабирование размера диффузионной модели.
  • Мы представляем новый пороговый диффузионный пробоотборник, который позволяет использовать очень большие направляющие веса без классификатора.
  • Мы представляем новую эффективную архитектуру U-Net, которая более эффективна с точки зрения вычислений, памяти и быстрее сходится.
  • На COCO мы достигаем нового современного COCO FID 7,27; и оценщики-люди считают, что образцы Imagen не уступают эталонным изображениям с точки зрения выравнивания изображения и текста.

Imagen представляет новый современный COCO FID.
Модель COCO FID ↓ ​​
Обучение на COCO
AttnGAN (Xu et al., 2017) 35,49
DM-GAN (Zhu et al., 2019) 32,64
DF-GAN (Тао и др., 2020) 21,42
DM-GAN + CL (Ye et al., 2021) 20,79
XMC-GAN (Чжан и др., 2021) 9,33
ЛАФИТ (Чжоу и др., 2021) 8.12
Make-A-Scene (Gafni et al., 2022) 7,55
Не обучался работе с COCO
ДАЛЛ-Э (Рамеш и др., 2021) 17,89
GLIDE (Nichol et al., 2021) 12,24
ДАЛЛ-Э 2 (Рамеш и др. , 2022) 10,39
Imagen (наша работа) 7,27

  • Параллельная оценка человека.
  • Систематически проверяйте: композиционность, кардинальность, пространственные отношения, длинный текст, редкие слова и сложные подсказки.
  • Оценщики-люди категорически предпочитают Imagen другим методам как в отношении выравнивания изображения и текста, так и в точности изображения.

Нажмите на слово ниже и Imagen!

Фотография картины маслом с изображением

пушистая панда британская короткошерстная кошка персидская кошка сиба-ину собака енот

в ковбойской шляпе и солнцезащитных очках и

красная рубашка черная кожаная куртка

игра на гитаре езда на велосипеде скейтбординг

в саду. на пляже. на вершине горы.

Диффузионные модели добились большого успеха в генерации изображений [1, 2, 3, 4]. Модели авторегрессии [5], GAN [6, 7] Методы на основе VQ-VAE Transformer [8, 9] добились значительного прогресса в исследованиях преобразования текста в изображение. Совсем недавно модели Diffusion были исследованы для генерации текста в изображение [10, 11], включая параллельную работу DALL-E 2 [12]. DALL-E 2 использует предварительную диффузию для скрытых CLIP и модели каскадной диффузии для создания изображений с высоким разрешением 1024×1024. Мы считаем, что Imagen намного проще, так как Imagen не требует изучения латентного априорного анализа, но при этом достигает лучших результатов как в MS-COCO FID, так и в параллельной оценке человеком на DrawBench. GLIDE [10] также использует каскадные модели диффузии для преобразования текста в изображение, но Imagen использует более крупные предварительно обученные замороженные языковые модели, которые, как мы обнаружили, играют важную роль как для точности изображения, так и для выравнивания изображения и текста. XMC-GAN [7] также использует BERT в качестве текстового кодировщика, но мы масштабируем текстовые кодировщики гораздо большего размера и демонстрируем их эффективность. Использование каскадных моделей диффузии также популярно в литературе [13, 14] и успешно используется в моделях диффузии для создания изображений с высоким разрешением [2, 3]. Наконец, Imagen является частью серии работ по преобразованию текста в изображение в Google Research, включая родственную модель Parti.

Существует несколько этических проблем, с которыми сталкиваются исследования преобразования текста в изображение в целом. Мы предлагаем более подробное исследование этих проблем в нашей статье и предлагаем краткую версию здесь. Во-первых, последующие приложения моделей преобразования текста в изображение разнообразны и могут сложным образом влиять на общество. Потенциальные риски неправильного использования вызывают опасения в отношении ответственного открытого исходного кода кода и демонстраций. В настоящее время мы решили не выпускать код или публичную демонстрацию. В будущей работе мы изучим структуру ответственной экстернализации, которая уравновешивает ценность внешнего аудита с рисками неограниченного открытого доступа. Во-вторых, требования к данным для моделей преобразования текста в изображение вынуждают исследователей в значительной степени полагаться на большие, в основном некурируемые наборы данных, извлеченные из Интернета. Хотя этот подход позволил в последние годы добиться быстрого прогресса в алгоритмах, наборы данных такого рода часто отражают социальные стереотипы, репрессивные точки зрения и уничижительные или иным образом вредные ассоциации с маргинализованными группами идентичности. Хотя подмножество наших обучающих данных было отфильтровано для удаления шума и нежелательного контента, такого как порнографические изображения и оскорбительные выражения, мы также использовали набор данных LAION-400M, который, как известно, содержит широкий спектр неприемлемого контента, включая порнографические изображения, расистские оскорбления и вредные социальные стереотипы. Imagen полагается на текстовые кодировщики, обученные на некурируемых данных веб-масштаба, и, таким образом, наследует социальные предубеждения и ограничения больших языковых моделей. Таким образом, существует риск того, что Imagen закодировал вредные стереотипы и представления, что определяет наше решение не выпускать Imagen для публичного использования без дополнительных мер безопасности.

Наконец, в то время как была проведена обширная работа по аудиту моделей преобразования изображения в текст и маркировки изображений для форм социальной предвзятости, было сравнительно меньше работы над методами оценки социальной предвзятости для моделей преобразования текста в изображение. Концептуальный словарь потенциального вреда моделей преобразования текста в изображение и установленные метрики оценки являются важным компонентом разработки ответственных практик выпуска моделей. Хотя мы оставляем углубленный эмпирический анализ социальных и культурных предубеждений на будущее, наши небольшие внутренние оценки выявили несколько ограничений, которые определяют наше решение не выпускать нашу модель в настоящее время. Imagen может столкнуться с опасностью отказа от режимов распределения данных, что может еще больше усугубить социальные последствия предвзятости набора данных. Imagen имеет серьезные ограничения при создании изображений, изображающих людей. Наши человеческие оценки показали, что Imagen получает значительно более высокие показатели предпочтения при оценке изображений, на которых не изображены люди, что указывает на ухудшение качества изображения. Предварительная оценка также предполагает, что Imagen кодирует несколько социальных предубеждений и стереотипов, в том числе общую предвзятость в отношении создания изображений людей с более светлым оттенком кожи и тенденцию к тому, чтобы изображения, изображающие разные профессии, соответствовали западным гендерным стереотипам. Наконец, даже когда мы фокусируем внимание поколений на людях, наш предварительный анализ показывает, что Imagen кодирует ряд социальных и культурных предубеждений при создании изображений действий, событий и объектов. Мы стремимся добиться прогресса в решении некоторых из этих открытых проблем и ограничений в будущей работе.

Художественная галерея с картинами Моне. Художественная галерея затоплена. Роботы ходят по художественной галерее, используя весла. Художественная галерея, где выставлены картины Моне. Художественная галерея затоплена. Роботы ходят по художественной галерее, используя доски для весла. Величественная картина маслом королевы енотов в красном французском королевском платье. Картина висит на богато украшенной стене, украшенной обоями. Величественная картина маслом королевы енотов в красном французском королевском платье. Картина висит на богато украшенной стене, украшенной обоями. Голубая сойка стоит на большой корзине с радужными макаронами. Голубая сойка стоит на большой корзине с радужными макаронами. Гигантская змея-кобра на ферме. Змея сделана из кукурузы. Гигантская змея-кобра на ферме. Змея сделана из кукурузы.

Chitwan Saharia * , William Chan * , Saurabh Saxena , Lala Li , Jay Whang , Emily Denton, Seyed Kamyar Seyed Ghasemipour, Burcu Karagol Ayan, S. Sara Mahdavi, Rapha Gontijo Лопес, Тим Салиманс, Джонатан Хо , Дэвид Флит , Мохаммад Норузи *

* Равный вклад. Основной вклад.

Мы благодарим Бена Пула за рецензирование нашей рукописи, ранние обсуждения и многочисленные полезные комментарии и предложения на протяжении всего проекта. Особая благодарность Кэти Мейер-Хеллстерн, Остину Таранго и Саре Ласло за помощь в внедрении важных ответственных методов искусственного интеллекта в этот проект. Мы ценим ценные отзывы и поддержку от Элизабет Адкисон, Зубина Гахрамани, Джеффа Дина, Йонгхуи Ву и Эли Коллинза. Мы благодарны Тому Смоллу за разработку водяного знака Imagen. Мы благодарим Джейсона Болдриджа, Хана Чжана и Кевина Мерфи за первоначальные обсуждения и отзывы. Мы признательны Фреду Алкоберу, Хибаку Али, Мариан Кроук, Аарону Донсбаху, Талси Доши, Тоджу Дьюку, Дугласу Эку, Джейсону Фрейденфельдсу, Брайану Габриэлю, Молли ФитцМоррис, Дэвиду Ха, Филипу Пархэму, Лоре Пирс, Эвану Рапопорту, Лорен за их усердную работу и поддержку.

Автор записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *