Перейти к содержанию

Stable Diffusion 1

В этой статье рассматриваются файнтьюны на основе Stable Diffusion 1, подходящие для генерации аниме.

Схема наследования крупных файнтьюнов для Stable Diffusion 1:

flowchart TD

%% Nodes
SD1.2["Stable Diffusion 1.2"]
SD1.4["Stable Diffusion 1.4"]
SD1.5["Stable Diffusion 1.5"]
WD1.3["Waifu Diffusion v1.3"]
NAI1["NovelAI v1"]
hll+EasyFluff["Генерация аниме на фурри-моделях"]

%% Relationships between models
SD1.2 --> SD1.5
SD1.2 --> SD1.4
SD1.4 --> WD1.3
SD1.4 --> NAI1
SD1.5 --> FluffyRock
FluffyRock --(merge)--> EasyFluff
EasyFluff --> hll+EasyFluff
hll-ликорис --> hll+EasyFluff

%% Clickable links
click SD1.2 "https://huggingface.co/CompVis/stable-diffusion-v1-2"
click SD1.4 "https://huggingface.co/CompVis/stable-diffusion-v1-4"
click NAI1 "https://huggingface.co/NovelAI/nai-anime-v1-full"
click WD1.3 "https://huggingface.co/hakurei/waifu-diffusion-v1-3"
click FluffyRock "https://civitai.com/models/92450?modelVersionId=124661"
click EasyFluff "https://civitai.com/models/129996/easyfluff"
click hll-ликорис "https://huggingface.co/CluelessC/hll-test/tree/main/lyco"
click hll+EasyFluff "https://rentry.org/5exa3"

%% Styling
classDef no-link fill:#FFF9C4,stroke:#FBC02D,stroke-width:2px;
classDef link fill:#FFF9C4,stroke:#FBC02D,stroke-width:2px,color:#4051b5;
class SD1.2,SD1.4,WD1.3,NAI1,FluffyRock,EasyFluff,hll-ликорис,hll+EasyFluff link;
class SD1.5 no-link;

FAQ

Какой чекпоинт выбрать?
Stable Diffusion v1 и его производные являются устаревшими моделями на момент 2025 года.

Вместо них, рекомендуется обратить внимание на чекпоинты из семейства Stable Diffusion XL. В отдельных случаях вам так же может быть интересен FLUX.

Использовать чекпонты на основе Stable Diffusion v1 в 2025 году может иметь смысл по следующим причинам:

  • У вас слабое железо для запуска чекпоинтов на базе Stable Diffusion XL
  • Либо чтобы использовать инструменты, доступные только для Stable Diffusion v1 (например Controlnet QR Code Monster v2 For SD-1.5 )

Какой чекпоинт из семейства Stable Diffusion v1 выбрать?
EasyFluff + HLL-ликорис

Stable Diffusion v1

Stable Diffusion v1.4 - это модель, выпущенная Stability AI в августе 2022 года. Это первая из открытых моделей для генерации изображений, ставшая массовой.

Выпуску Stable Diffusion v1.4 предшествовали модели 1.1, 1.2 и 1.3. Схему наследования можно увидеть ниже:

flowchart TD

%% Nodes
SD1.1["Stable Diffusion 1.1"]
SD1.2["Stable Diffusion 1.2"]
SD1.3["Stable Diffusion 1.3"]
SD1.4["Stable Diffusion 1.4"]
SD1.5["Stable Diffusion 1.5"]

%% Relationships between models
SD1.1 --> SD1.2
SD1.2 --> SD1.3
SD1.2 --> SD1.4
SD1.2 --> SD1.5

%% Clickable links
click SD1.1 "https://huggingface.co/CompVis/stable-diffusion-v1-1"
click SD1.2 "https://huggingface.co/CompVis/stable-diffusion-v1-2"
click SD1.3 "https://huggingface.co/CompVis/stable-diffusion-v1-3"
click SD1.4 "https://huggingface.co/CompVis/stable-diffusion-v1-4"

%% Styling
classDef no-link fill:#FFF9C4,stroke:#FBC02D,stroke-width:2px;
classDef link fill:#FFF9C4,stroke:#FBC02D,stroke-width:2px,color:#4051b5;
class SD1.1,SD1.2,SD1.3,SD1.4 link;
class SD1.5 no-link;
Версия модели Число шагов Размер изображений Датасет
v1.1 237k + 194k 256x256 + 512x512 LAION-2B-en и laion-high-resolution
v1.2 515k 512x512 LAION-2B-en с фильтрацией по эстетике
v1.3 195k 512x512 LAION-2B-en с фильтрацией по эстетике, в 10% обучалось без текста
v1.4 225k 512x512 LAION-2B-en с улучшенной фильтацией по эстетике, в 10% обучалось без текста
v1.5 595k 512x512 LAION-2B-en с улучшенной фильтацией по эстетике, в 10% обучалось без текста

Для обучения каждой модели использовалось 256 x A100 GPUs с итоговым batch size 2 x 8 x 2 x 4 = 2048.

Суммарно на семейство моделей Stable Diffusion v1 было потрачено 150,000 GPU-часов.

Оригинальные модели из семейства Stable Diffusion v1 слабо подходят для генерации аниме. Однако, эти модели послужили хорошей базой для дальнейших файнтьюнов, о которых и пойдёт речь ниже.

Скандал с CSAM в датасете LAION-5B и последующее удаление Stable Diffusion v1.5 из публичного доступа

В августе 2024, Stable Diffusion v1.5 был удалён со всех официальных источников. Представители StabilityAI не давали официальных комментариев по произошедшему.

Этому событию предшествовали расследования нескольких институтов и "независимых исследователей", которые нашли в LAION-5B (надмножество LAION-2B) около 140-2000 (в зависимости от эксперта) изображений, классифицированных как детская порнография; вследствии чего эти датасеты были удалены с Hugging Face.

Неудовлетворившись результатом, эксперты "по безопасному и этичному AI" требовали удалить из публичного доступа все модели, обученные с использованием данных датасетов (речь, в первую очередь, про Stable Diffusion v1), а так же любые производные от них модели.

Так же, данными исследователями ранее критиковалась сама идея открытых релизов моделей, поскольку существуют механизмы дообучения моделей и LoRA, что позволит генерировать CSAM, даже если исходные датасеты были безопасны.

Многие связывают эти два события, а отсутствие комментариев StabilityAI только усиливает подозрения. Сама новость была воспринята с экстазом различными экспертами по безопасному AI, и они пообещали и дальше работать над усилением контроля открытых моделей и датасетов.

Waifu Diffusion v1.3

Waifu Diffusion v1.3 - это первый получивший известность крупный аниме-файнтьюн, выполненный энтузиастами.

Данная модель была обучена в октябре 2022. Датасет состоял из 680k аниме-картинок.

Релиз Waifu Diffusion v1.3 совпал со сливом NovelAI v1. В результате, Waifu Diffusion v1.3 не получил какой-либо популярности, так как заметно проигрывал своему конкуренту в качестве.

NovelAI v1

NovelAI - это подписочный онлайн-сервис, который который позволяет генерировать истории и изображения при помощи набора разработанных командой данного сервиса нейросетей.

В октябре 2022 года, когда NovelAI только запустили сервис для генерации изображений в стиле аниме, веса их модели практически сразу же были опубликованы утекли в публичный доступ, благодаря чему кто-угодно мог начать генерировать изображения локально, без какой-либо платы.

С момента слива было выпущено огромное количество основанных на NAI мёрджей и файнтьюнов, большая часть из них может быть найдена на цивите.

Подавляющее большинство SD1 чекпоинтов для генерации аниме в той или иной степени основано на утечке NAI.


Летом 2024 года (почти спустя два года после утечки) NovelAI выпустили свою модель в публичный доступ официально, так что никому больше не нужно переживать за правовой статус использования данного чекпоинта.

EasyFluff + HLL

История о том, как меня перестали пугать фурри-модели и я начал генерировать на них аниме

EasyFluff представляет собой мёрдж на основе FluffyRock, который является файнтьюном Stable Diffusion 1.5.

Специализацией EasyFluff и FluffyRock является генерация фуррей.

В ноябре 2023 аноном в форча был обучен крупный ликорис (800Мб при весе модели в 2Гб), благодаря которому стало возможным генерировать обычных аниме-тяночек на данном чекпоинте.

Связка EasyFluff с подключённым HLL-ликорисом была наилучшим решением для генерации NSFW до момента выхода Pony Diffusion V6 XL в январе 2024.

Данный подход может быть интересен тем, чьё железо не позволяет комфортно запускать SDXL-чекпонты

Особенности связки EasyFluff + HLL

  • Высокое базовое разрешения (вплоть до 1088 пикселей) без потери когерентности
  • Наилучшее понимание NSFW-концептов среди всех SD1 чекпоинтов
  • Знание огромного количества аниме-художников из коробки
  • Понимание тегов в стиле danbooru и e621
  • Совместимость с лорами для NAIv1

Как установить

  1. Скачать EasyFluff
  2. Скачать yaml-конфиг и разместить его в директории с моделью
  3. Скачать hll-ликорис и использовать его в паре с моделью

Картинка с PNG-Info для примера.


Готовые мёрджи

Очевидная идея — почему-бы просто не смёрджить EasyFluff + HLL и использовать данный мёрдж как самостоятельный чекпоинт?

Именно такой подход реализован в семействе Based моделей, начиная с 68 версии:

Based

LS_Kerberos

  • Huggingface
    (используется тот же рецепт, что в Based, но дополнительно добавлен LS Vividus)

Дополнительные ссылки

Общее

ControlNet-модели