Главная

    Добро пожаловать на 2ch /nai/ вики!
  

Здесь ты найдёшь всю необходимую информацию, чтобы начать генерировать аниме-тяночек, используя новейшие разработки в нейросетевых технологиях. Используй навигатор на левой панели, чтобы найти нужную тебе информацию.

~~Данная вики ведётся анонимными специалистами по машинному обучению мирового уровня и активно дополняется.~~

FAQ

Как генерировать на своём железе?¶

Необходимо установить пользователький интерфейс для работы с нейронками и скачать любую понравившуюся модель.

Краткое руководство по вкату (NVidia)

Скачай последний релиз интерфейса Forge
Зарегистрируйся на https://civitai.com, после чего скачай любую понравившуюся модель. В качестве рекомендации можешь обратить внимание на одну из следующих моделей:
- WAI-NSFW-illustrious-SDXL - популярный мёрдж на основе Illustrious-XL. Дает приятный базовый стиль и менее требователен к промпту (текстовому запросу), что делает его хорошим вариантом для тех, кто не хочет заморачиваться с тонкой настройкой.
- NoobAI-XL - файнтьюн Illustrious-XL, лучше подходит для сложных стилистических запросов и вариативнее в генерации, но требует больше внимания к промпту.
Зайди в папку Forge и перебрось скачанный файл с моделью в директорию /models/Stable-diffusion
Запусти update.bat и дождись завершения операции
Запусти run.bat и дождись, пока подтянутся все зависимости и откроется веб интерфейс по адресу http://127.0.0.1:7860

Для начала можешь использовать такие настройки генерации (пример для WAI-NSFW-illustrious-SDXL):

Sampling method: Euler a
Schedule type: Automatic
Sampling steps: 15-30
CFG Scale: 5-7
Разрешение изображения: 1024 x 1360 - можешь экспериментировать с соотношением сторон, но не выставляй разрешение сильно выше одного мегапикселя. Для получения более крупных картинок используй техники апскейла, такие как Hires. fix
Начинай свой промпт с перечисления буру-тегов, описывающих то, что ты хочешь видеть на изображении. В конце промпта добавь теги качества:
```
masterpiece, best quality, amazing quality
```

Негативный промпт:

bad quality, worst quality, worst detail, sketch, censor

Примеры промтов можно посмотреть на civitai в описании к картинкам.

Модель знает часть старых персонажей. Если кто-то не получается, то нужно скачать/обучить LoRA-модель на этого персонажа. Так же существуют множество LoRA-моделей на стили разных художников.

Если предпочитаешь более подробные руководства, то можешь ознакомиться с гайдами в зависимости от твоей видеокарты: NVidia или AMD.

Как генерировать в облаке?¶

Самый простой способ - это использовать онлайн-сервис civitai.com:

Регистрируешься на цивите, используя любую фейковую почту, например https://10minemail.com
Открываешь на цивите любую картинку, которая тебе понравилась, например эту
Жмёшь "Remix"
В поле Prompt меняешь запрос на нужный тебе
Жмёшь "Generate"

На цивите есть лимиты по числу генераций, но можно создать несколько аккаунтов, чтобы обходить эти ограничения.

Кроме того, можно зарабатывать встроенную валюту несколькими разными способами, например, лайкать свои же картинки на других аккаунтах. Полный список того, за что дают валюту, можно найти на этой странице.

На цивите присутствует цензура, блокирующая определённые запросы. Со списом запрещённых слов можешь ознакомиться здесь и здесь.

Список прочих сервисов для генерации в облаке описан в этой статье.

Какие системные требования для запуска этих нейронок на своём железе?¶

В первую очередь, всё зависит от количества видеопамяти (VRAM) на твоей машине. Разные чекпоинты (модели) требуют разное количество видеопамяти.

Таблица актуальна для NVidia:

Базовая модель	Минимальный объём VRAM	Рекомендуемый объём VRAM
Stable Diffusion 1	4 GB VRAM	8 GB VRAM
Stable Diffusion XL	8 GB VRAM	12 GB VRAM
FLUX	12 GB VRAM	24 GB VRAM

Потребуется около 10-20 GB свободного места на жёстком диске, чтобы установить все необходимые для запуска нейронок интерфейсы и библиотеки.

Кроме этого, тебе нужно будет скачать, как минимум, один чекпоинт, который ты будешь запускать:

Базовая модель	Требуемый объём на жёстком диске
Stable Diffusion 1	от 2 GB до 4 GB
Stable Diffusion XL	6.5 GB
FLUX	от 4 GB до 24 GB на основную модель + от 2.5 GB до 19 GB на текстовый энкодер

Рекомендуется размещать все связанные с нейронками файлы на SSD. Впрочем, это повлияет только на скорость загрузки интерфейсов и моделей - на скорость генерации это не влияет.

Что насчёт цензуры?¶

Наиболее популярные локальные модели не имеют какой-либо цензуры. Однако, модель может не знать какие-то концепты/фетиши, что, впрочем, исправляется при помощи такого механизма, как LoRA.

Для NSFW рекомендуется, в первую очередь, обратить внимание на модели WAI-NSFW-illustrious-SDXL и NoobAI-XL. В случае, если доступный тебе объём видеопамяти не позволяет запускать XL-чекпонты, рекомендуется обратить внимание на EasyFluff + HLL.

В онлайн-сервисах по типу civitai.com существует цензура, блокирующая определённые запросы. Со списом запрещённых на CivitAI слов можешь ознакомиться здесь и здесь.

Какой интерфейс выбрать начинающему?¶

Forge - наиболее передовой из user-friendly интерфейсов в сфере картинко-генераций. Рекомендуется начать с него.

Где искать модели?¶

civitai.com - самый крупный ресурс, хранящий модели, лоры и всё прочее. Фактически, это основной поисковик в сфере картинко-генераций.

Какую модель выбрать начинающему?¶

WAI-NSFW-illustrious-SDXL - популярный мёрдж на основе Illustrious-XL. Дает приятный базовый стиль и менее требователен к промпту (текстовому запросу), что делает его хорошим вариантом для тех, кто не хочет заморачиваться с тонкой настройкой.

NoobAI-XL - файнтьюн Illustrious-XL, лучше подходит для сложных стилистических запросов и вариативнее в генерации, но требует больше внимания к промпту.

Нейронки знают персонажа %waifuname%?¶

Зависит от того, насколько твоя вайфу популярна - Хатсуне Мику или Аску Лэнгли знает любая уважающая себя аниме модель. Но вон ту няшу из текущего онгоинга, вероятно, ни одна из моделей не знает.

Впрочем, не стоит отчаиваться, ведь существует такой механизм как LoRA, который позволит тебе сгенерировать нужного персонажа, даже если основная модель о нём не знает.

Что такое LoRA?¶

Метод дообучения нейросетевых моделей, главной особенностью которого является то, что он не вносит изменения в обучаемую модель. Вместо этого создаётся небольшой файл, содержащий патч с изменениями.

Подробнее смотри в этой статье.

Что такое ControlNet?¶

Cпособ управления процессом генерации изображения с помощью дополнительных нейросетей. Ты можешь задавать дополнительные условия, например, контуры, глубину или позу человека, чтобы получить более точный и желаемый результат.

Подробнее смотри в этой статье.

Как активировать тёмный интерфейс?¶

Добавь --theme dark в параметрах запуска батника.

Как мне поставить генерацию картинок на ночь?¶

Правая кнопка мыши на кнопку "Generate" -> "Generate forever".

Как восстановить последние использованные настройки после перезапуска интерфейса?¶

Вариант 1: Используй синюю кнопку со стрелкой, которая находится под кнопкой генерации

Вариант 2: Используй плагин stable-diffusion-webui-state

Поставь плагин, перезапусти автоматик, перейди в Settings -> State и там выбери, какие из настроек ты хочешь сохранять после перезапуска.

Вариант 3: Используй плагин Config-Presets

Как мне вынести настройки VAE и Clip-skip в верхнюю часть интерфейса?¶

Открой "Settings -> User interface" и выстави в поле "Quicksettings list" следующую строку:

sd_model_checkpoint,sd_vae,CLIP_stop_at_last_layers

Картинка с инструкцией

Как вы создаёте эти огромные 4k/8k картинки?¶

При помощи различных техник апскейла, таких как тайловый апскейл с помощью скрипта SD Upscale или плагина multidiffusion-upscaler-for-automatic1111.

Подробнее смотри в этой статье.

Генерируются чёрные квадраты¶

У тебя проблема с VAE, смотри решение здесь.

Почему у персонажа неправильное количество пальцев?¶

Это общая проблема всех диффузионных моделей. Либо используй читы в виде какого-нибудь из тегов рода:

arms behind head
arms behind back
arms between legs
arms in pockets

Либо придётся исправлять кривые пальцы после генерации через Inpaint.

Почему персонаж генерируется несколько раз на одной картинке?¶

Используй позитивные теги 1girl, solo и негативные 2girls, multiple characters
Уменьши стартовый размер картинки и увеличивай её при помощи алгоритма Hires. fix
Если ты уже используешь Hires. fix, то уменьши denoising strength

Ты дочитал FAQ до конца. Молодец!

Если у тебя остались ещё вопросы, спрашивай в Anime Diffusion треде.