🎨 Flux.2 Klein: Konzistentní Character Dataset Builder pro ComfyUI

Workflow od Sarcastic TOFU, které vám z jediné referenční fotky postaví kompletní dataset pro trénink vlastního LoRA modelu — rychle, jednoduše, i na slabším GPU.

Chcete trénovat LoRA model na vlastní postavu, ale nechcete řešit složité pipeline, desítky nastavení a hodiny čekání? Tohle workflow je přesně pro vás. Je navržené tak, aby bylo přístupné úplným začátečníkům — a přitom dostatečně výkonné pro pokročilé uživatele.

🎯 Co to je a proč je to jiné

Flux.2 Klein Consistent Character Dataset Builder (Flux.2_Klein_CCDB_v1) je ComfyUI workflow od autora Sarcastic TOFU, které využívá model Flux.2 Klein (4B nebo 9B) k budování konzistentních character datasetů přímo z jednoho referenčního obrázku. Výsledky pak můžete použít k trénování vlastního LoRA modelu.

Na rozdíl od starších přístupů využívajících SDXL nebo standardní Flux, zde nejsou žádné zdlouhavé procesy. Flux.2 Klein je architektonicky navržen tak, aby přirozeně zachovával a znovu používal detaily postavy z referenčního obrázku — a to bez nutnosti složitého nastavování.

Jde o vylepšenou adaptaci autorových předchozích workflow postavených na QWEN Image Edit a Kontext — s výrazně lepší rychlostí i kvalitou výstupů.

⚡ Co Flux.2 Klein vlastně je

Flux.2 Klein 4B a 9B jsou nová rodina vysokorychlostních AI generátorů obrazu využívající architekturu rectified flow, která sjednocuje generování i profesionální editaci obrázků do jednoho kompaktního balíčku. Díky technice step distillation dokáže model vytvořit kvalitní obrázky již ve 4 krocích — tedy řádově rychleji než starší modely vyžadující desítky kroků.

Model 4B — licence Apache 2.0, volný pro osobní i komerční použití
Model 9B — Non-Commercial License, pro výzkum a osobní projekty
Podporuje 11 nativních poměrů stran, výstupy až do 4 megapixelů (2048×2048)
FP8 verze je ~1,6× rychlejší a šetří 40 % VRAM oproti plnému modelu
NVFP4 verze je až 2,7× rychlejší a šetří 55 % VRAM

🖥️ Požadavky na GPU a dostupné modely

Workflow je navrženo tak, aby fungovalo na co nejširší škále hardware:

2–4 GB VRAM — nejlehčí GGUF verze Flux.2 Klein 4B (Q2 nebo Q3)
6–8 GB VRAM — Flux.2 Klein 9B Q2 GGUF (použitý přímo autorem workflow na AMD GPU)
8–12 GB VRAM — Flux.2 Klein 4B plný model nebo Q4/Q8 GGUF verze
12 GB+ VRAM — plný unquantizovaný Flux.2 Klein 9B pro nejlepší výsledky

Autor sám použil při vývoji Flux.2 Klein 9B Q2 GGUF na AMD GPU s 8 GB VRAM — s výbornými výsledky. Pokud máte silnější kartu, jednoduše vyměňte model za vyšší kvantizaci nebo plnou verzi.

🚀 Jak na to — krok za krokem

1. Příprava a instalace

Nainstalujte GGUF addon pro ComfyUI přes ComfyUI Manager
Vytvořte si účet na Hugging Face — budete ho potřebovat ke stahování modelů
Stáhněte vybraný Flux.2 Klein GGUF model a text encoder, umístěte je do správných složek

2. Výběr modelu

Vyberte požadovaný GGUF soubor Flux.2 Klein (4B nebo 9B) přímo ve workflow
Pokud máte silnější GPU, můžete soubory vyměnit za plné unquantizované verze

3. Referenční obrázek a pojmenování postavy

Nahrajte jednu čistou referenční fotku vaší postavy
Zadejte křestní jméno a příjmení postavy — workflow je použije pro organizaci výstupu

4. Rozměry obrázků

Nastavte společné rozměry pro celý dataset (768×1024 je dobrý výchozí bod pro portrét)
Stručný návod pro výběr rozměrů je přímo v poznámkové sekci workflow

5. Batche promptů

Zadejte instrukce v přirozeném jazyce: „subject seen from the left side", „Make this person wear a blue jacket"
V archivu workflow najdete připravené .txt soubory s prompty pro pózy a oblečení
Přidejte společné negativní filtry nebo použijte přiložené výchozí hodnoty

6. Sampling a spuštění

Nastavte sampling method, CFG a počet kroků — nebo ponechte výchozí hodnoty
Stiskněte Run a čekejte — workflow je rychlé
Výstup se automaticky uloží do složky output/JmenoPrijmeni/

💾 Prompt Saver — proč je to důležité

Klíčová funkce tohoto workflow je automatické ukládání promptů do čitelných .txt souborů. Každý vygenerovaný obrázek dostane svůj odpovídající textový soubor se všemi metadaty a použitým promptem.

To je zásadní výhoda při trénování LoRA: vaše dataset složka je okamžitě připravena — obrázky a jejich popisy jsou spárované, pojmenované a organizované. Žádné manuální doplňování captionů zpětně.

💡 Tipy pro lepší výsledky

Pro začátečníky

Začněte s 6–10 obrázky, ne s 20 — nejprve ověřte kvalitu a konzistenci
Referenční fotka by měla být čistá, ideálně bez rušného pozadí
Popisujte to, co chcete vidět — ne to, co si představujete
Použijte přiložené .txt soubory s připravenými prompty jako výchozí bod

Pro pokročilé

Experimentujte s CFG škálou pro různou míru variability výstupů
Kombinujte různé sampling metody (DPM++, Euler) pro rozmanitější dataset
Část datasetu generujte v jednom stylu osvětlení, část v jiném — trénink ocení diverzitu
Pro nejlepší konzistenci používejte Q4 nebo Q8 GGUF verze místo Q2

✅ Shrnutí výhod

✅ Funguje z jediné referenční fotky bez složité přípravy
✅ Přirozený jazyk místo technických promptů — přístupné začátečníkům
✅ Automatické ukládání promptů a metadat = dataset připravený k trénování
✅ Výborné zachování detailů postavy díky architektuře Flux.2 Klein
✅ Běží i na starých AMD GPU s 6–8 GB VRAM
✅ Výrazně rychlejší než starší metody s SDXL nebo standardním Flux

⚠️ Na co si dát pozor

⚠️ Nainstalujte GGUF support přes ComfyUI Manager před spuštěním
⚠️ Potřebujete účet na Hugging Face pro stahování modelů a text encoderů
⚠️ Soubory modelů musí být umístěny ve správných složkách ComfyUI
⚠️ Referenční fotka bez rušného pozadí = lepší a konzistentnější výsledky
⚠️ Model 9B je pouze pro nekomerční použití — pro komerční projekty sáhněte po verzi 4B

📦 Kde workflow najdete

Workflow je dostupné na Civitai od autora Sarcastic TOFU. Aktuálně je v Early Access — brzy bude k dispozici zdarma. Součástí archivu jsou i připravené .txt soubory s prompty pro pózy a outfity, které vám výrazně urychlí celý proces.

Odkaz: civitai.com — Flux.2_Klein_CCDB_v1