Pony Diffusion V6 XL¶
Pony Diffusion V6 XL (так же известный как Pony Diffusion или PonyXL) является самым популярным файнтьюном Stable Diffusion XL.
Несмотря на название, эта модель умеет генерировать не только поней, но и аниме. Данная модель получила большую популярность в связи с тем, что умеет генерировать сложные позы и NSFW концепты с малым числом проблем в анатомии (в сравнении с другими чекпоинтами).
Данная модель была обучена энтузиастом с никнеймом Astralite, известным своей любовью к франшизе My Little Pony.
Основанные на Pony Diffusion модели¶
Большую часть мёрджей/тьюнов поней можно найти на цивите - доступных моделей на основе поней настолько много, что на цивите под них выделили отдельную категорию.
Как правило, лоры и контролнеты от поней совместимы со всеми производными чекпоинтами.
AutismMix¶
Выбор ньюфага
Рекомендуется начать с этого чекпоинта, как наиболее беспроблемного.
Наиболее популярным производным чекпоинтом от поней является AutismMix, который представляет собой мёрдж поней с несколькими лорами.
Данный чекпоинт улучшает базовый стиль и анатомию, но ценой является снижение вариативности генераций.
Где взять лоры¶
ControlNet-модели¶
В случае Anytest, нужно качать модели, отмеченные символами p
(cnlllite-anytest_P...) и pn
(CN-anytest_v3-...pn...).
Особенности написания промптов¶
Теги качества¶
В positive prompt нужно добавлять:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, source_anime
В negative prompt стоит добавлять:
source_pony, source_furry, source_cartoon
Объяснение score_9 и прочего
Наиболее подробное описание принципа работы скоров дал сам автор поней в своей статье на цивите.
Если вкратце, то, перед обучением PonyXL, сперва был обучен aesthetic-классификатор, задачей которого было определить "качество" изображения в формате плавающей цифры от нуля до единицы.
Говоря проще, данный классификатор являлся инструментом, который помогал отделять низкосортные любительские картинки от шедевров.
Данный классификатор использовался для оценки каждого изображения в датасете Pony Diffusion. В зависимости от оценки классификатора, для каждого изображений, в добавок к основному запросу, была добавлена строка с описанием тегов качества в следующем формате:
- Качество 90%-100%: score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up
- Качество 80%-90%: score_8, score_7_up, score_6_up, score_5_up, score_4_up
- Качество 70%-80%: score_7, score_6_up, score_5_up, score_4_up
И так далее.
Теоретическая задумка была в том, чтобы, указывая тег score_9, мы бы "просили" модель ориентироваться, в первую очередь, на картинки, которые получили aestetic-оценку 90% и выше, что должно было снижать вариативность, но улучшать качество изображений.
Однако, сам автор поней считает, что он облажался, и, по факту, модель выучила, что вся строка целиком описывает хорошее качество, а не её отдельные части:
In reality I exposed myself to a variation of The Clever Hans effect where the model learned that the whole long string correlates to the "good looking" images, instead of separate parts of it. I will fix this in V7.
Как итог - общей рекомендацией по промптам для чекпоинтов на основе Pony Diffusion является использование подробной строки, описывающей максимальное качество, а именно:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up
Прочие теги¶
Кроме тегов качества, в датасете поней было использовано несколько вспомогательных тегов, которые вы также можете использовать в своих промптах.
Источник¶
- source_anime
- source_pony
- source_furry
- source_cartoon
Возрастной рейтинг¶
- rating_safe
- rating_questionable
- rating_explicit