🎨 Flux.2 Klein: Konzistentní Character Dataset Builder pro ComfyUI
Workflow od Sarcastic TOFU, které vám z jediné referenční fotky postaví kompletní dataset pro trénink vlastního LoRA modelu — rychle, jednoduše, i na slabším GPU.
Chcete trénovat LoRA model na vlastní postavu, ale nechcete řešit složité pipeline, desítky nastavení a hodiny čekání? Tohle workflow je přesně pro vás. Je navržené tak, aby bylo přístupné úplným začátečníkům — a přitom dostatečně výkonné pro pokročilé uživatele.
🎯 Co to je a proč je to jiné
Flux.2 Klein Consistent Character Dataset Builder (Flux.2_Klein_CCDB_v1) je ComfyUI workflow od autora Sarcastic TOFU, které využívá model Flux.2 Klein (4B nebo 9B) k budování konzistentních character datasetů přímo z jednoho referenčního obrázku. Výsledky pak můžete použít k trénování vlastního LoRA modelu.
Na rozdíl od starších přístupů využívajících SDXL nebo standardní Flux, zde nejsou žádné zdlouhavé procesy. Flux.2 Klein je architektonicky navržen tak, aby přirozeně zachovával a znovu používal detaily postavy z referenčního obrázku — a to bez nutnosti složitého nastavování.
Jde o vylepšenou adaptaci autorových předchozích workflow postavených na QWEN Image Edit a Kontext — s výrazně lepší rychlostí i kvalitou výstupů.
⚡ Co Flux.2 Klein vlastně je
Flux.2 Klein 4B a 9B jsou nová rodina vysokorychlostních AI generátorů obrazu využívající architekturu rectified flow, která sjednocuje generování i profesionální editaci obrázků do jednoho kompaktního balíčku. Díky technice step distillation dokáže model vytvořit kvalitní obrázky již ve 4 krocích — tedy řádově rychleji než starší modely vyžadující desítky kroků.
- Model 4B — licence Apache 2.0, volný pro osobní i komerční použití
- Model 9B — Non-Commercial License, pro výzkum a osobní projekty
- Podporuje 11 nativních poměrů stran, výstupy až do 4 megapixelů (2048×2048)
- FP8 verze je ~1,6× rychlejší a šetří 40 % VRAM oproti plnému modelu
- NVFP4 verze je až 2,7× rychlejší a šetří 55 % VRAM
🖥️ Požadavky na GPU a dostupné modely
Workflow je navrženo tak, aby fungovalo na co nejširší škále hardware:
- 2–4 GB VRAM — nejlehčí GGUF verze Flux.2 Klein 4B (Q2 nebo Q3)
- 6–8 GB VRAM — Flux.2 Klein 9B Q2 GGUF (použitý přímo autorem workflow na AMD GPU)
- 8–12 GB VRAM — Flux.2 Klein 4B plný model nebo Q4/Q8 GGUF verze
- 12 GB+ VRAM — plný unquantizovaný Flux.2 Klein 9B pro nejlepší výsledky
Autor sám použil při vývoji Flux.2 Klein 9B Q2 GGUF na AMD GPU s 8 GB VRAM — s výbornými výsledky. Pokud máte silnější kartu, jednoduše vyměňte model za vyšší kvantizaci nebo plnou verzi.
🚀 Jak na to — krok za krokem
1. Příprava a instalace
- Nainstalujte GGUF addon pro ComfyUI přes ComfyUI Manager
- Vytvořte si účet na Hugging Face — budete ho potřebovat ke stahování modelů
- Stáhněte vybraný Flux.2 Klein GGUF model a text encoder, umístěte je do správných složek
2. Výběr modelu
- Vyberte požadovaný GGUF soubor Flux.2 Klein (4B nebo 9B) přímo ve workflow
- Pokud máte silnější GPU, můžete soubory vyměnit za plné unquantizované verze
3. Referenční obrázek a pojmenování postavy
- Nahrajte jednu čistou referenční fotku vaší postavy
- Zadejte křestní jméno a příjmení postavy — workflow je použije pro organizaci výstupu
4. Rozměry obrázků
- Nastavte společné rozměry pro celý dataset (768×1024 je dobrý výchozí bod pro portrét)
- Stručný návod pro výběr rozměrů je přímo v poznámkové sekci workflow
5. Batche promptů
- Zadejte instrukce v přirozeném jazyce: „subject seen from the left side", „Make this person wear a blue jacket"
- V archivu workflow najdete připravené .txt soubory s prompty pro pózy a oblečení
- Přidejte společné negativní filtry nebo použijte přiložené výchozí hodnoty
6. Sampling a spuštění
- Nastavte sampling method, CFG a počet kroků — nebo ponechte výchozí hodnoty
- Stiskněte Run a čekejte — workflow je rychlé
- Výstup se automaticky uloží do složky
output/JmenoPrijmeni/
💾 Prompt Saver — proč je to důležité
Klíčová funkce tohoto workflow je automatické ukládání promptů do čitelných .txt souborů. Každý vygenerovaný obrázek dostane svůj odpovídající textový soubor se všemi metadaty a použitým promptem.
To je zásadní výhoda při trénování LoRA: vaše dataset složka je okamžitě připravena — obrázky a jejich popisy jsou spárované, pojmenované a organizované. Žádné manuální doplňování captionů zpětně.
💡 Tipy pro lepší výsledky
Pro začátečníky
- Začněte s 6–10 obrázky, ne s 20 — nejprve ověřte kvalitu a konzistenci
- Referenční fotka by měla být čistá, ideálně bez rušného pozadí
- Popisujte to, co chcete vidět — ne to, co si představujete
- Použijte přiložené .txt soubory s připravenými prompty jako výchozí bod
Pro pokročilé
- Experimentujte s CFG škálou pro různou míru variability výstupů
- Kombinujte různé sampling metody (DPM++, Euler) pro rozmanitější dataset
- Část datasetu generujte v jednom stylu osvětlení, část v jiném — trénink ocení diverzitu
- Pro nejlepší konzistenci používejte Q4 nebo Q8 GGUF verze místo Q2
✅ Shrnutí výhod
- ✅ Funguje z jediné referenční fotky bez složité přípravy
- ✅ Přirozený jazyk místo technických promptů — přístupné začátečníkům
- ✅ Automatické ukládání promptů a metadat = dataset připravený k trénování
- ✅ Výborné zachování detailů postavy díky architektuře Flux.2 Klein
- ✅ Běží i na starých AMD GPU s 6–8 GB VRAM
- ✅ Výrazně rychlejší než starší metody s SDXL nebo standardním Flux
⚠️ Na co si dát pozor
- ⚠️ Nainstalujte GGUF support přes ComfyUI Manager před spuštěním
- ⚠️ Potřebujete účet na Hugging Face pro stahování modelů a text encoderů
- ⚠️ Soubory modelů musí být umístěny ve správných složkách ComfyUI
- ⚠️ Referenční fotka bez rušného pozadí = lepší a konzistentnější výsledky
- ⚠️ Model 9B je pouze pro nekomerční použití — pro komerční projekty sáhněte po verzi 4B
📦 Kde workflow najdete
Workflow je dostupné na Civitai od autora Sarcastic TOFU. Aktuálně je v Early Access — brzy bude k dispozici zdarma. Součástí archivu jsou i připravené .txt soubory s prompty pro pózy a outfity, které vám výrazně urychlí celý proces.