Stable Diffusion

Flux.2 Klein Jednoduchý Konzistentní Tvůrce Character Datasetů s Ukládáním Promptů

Flux.2 Klein Jednoduchý Konzistentní Tvůrce Character Datasetů s Ukládáním Promptů

🎨 Flux.2 Klein: Konzistentní Character Dataset Builder pro ComfyUI

Workflow od Sarcastic TOFU, které vám z jediné referenční fotky postaví kompletní dataset pro trénink vlastního LoRA modelu — rychle, jednoduše, i na slabším GPU.

Chcete trénovat LoRA model na vlastní postavu, ale nechcete řešit složité pipeline, desítky nastavení a hodiny čekání? Tohle workflow je přesně pro vás. Je navržené tak, aby bylo přístupné úplným začátečníkům — a přitom dostatečně výkonné pro pokročilé uživatele.

🎯 Co to je a proč je to jiné

Flux.2 Klein Consistent Character Dataset Builder (Flux.2_Klein_CCDB_v1) je ComfyUI workflow od autora Sarcastic TOFU, které využívá model Flux.2 Klein (4B nebo 9B) k budování konzistentních character datasetů přímo z jednoho referenčního obrázku. Výsledky pak můžete použít k trénování vlastního LoRA modelu.

Na rozdíl od starších přístupů využívajících SDXL nebo standardní Flux, zde nejsou žádné zdlouhavé procesy. Flux.2 Klein je architektonicky navržen tak, aby přirozeně zachovával a znovu používal detaily postavy z referenčního obrázku — a to bez nutnosti složitého nastavování.

Jde o vylepšenou adaptaci autorových předchozích workflow postavených na QWEN Image Edit a Kontext — s výrazně lepší rychlostí i kvalitou výstupů.

⚡ Co Flux.2 Klein vlastně je

Flux.2 Klein 4B a 9B jsou nová rodina vysokorychlostních AI generátorů obrazu využívající architekturu rectified flow, která sjednocuje generování i profesionální editaci obrázků do jednoho kompaktního balíčku. Díky technice step distillation dokáže model vytvořit kvalitní obrázky již ve 4 krocích — tedy řádově rychleji než starší modely vyžadující desítky kroků.

  • Model 4B — licence Apache 2.0, volný pro osobní i komerční použití
  • Model 9B — Non-Commercial License, pro výzkum a osobní projekty
  • Podporuje 11 nativních poměrů stran, výstupy až do 4 megapixelů (2048×2048)
  • FP8 verze je ~1,6× rychlejší a šetří 40 % VRAM oproti plnému modelu
  • NVFP4 verze je až 2,7× rychlejší a šetří 55 % VRAM

🖥️ Požadavky na GPU a dostupné modely

Workflow je navrženo tak, aby fungovalo na co nejširší škále hardware:

  • 2–4 GB VRAM — nejlehčí GGUF verze Flux.2 Klein 4B (Q2 nebo Q3)
  • 6–8 GB VRAM — Flux.2 Klein 9B Q2 GGUF (použitý přímo autorem workflow na AMD GPU)
  • 8–12 GB VRAM — Flux.2 Klein 4B plný model nebo Q4/Q8 GGUF verze
  • 12 GB+ VRAM — plný unquantizovaný Flux.2 Klein 9B pro nejlepší výsledky

Autor sám použil při vývoji Flux.2 Klein 9B Q2 GGUF na AMD GPU s 8 GB VRAM — s výbornými výsledky. Pokud máte silnější kartu, jednoduše vyměňte model za vyšší kvantizaci nebo plnou verzi.

🚀 Jak na to — krok za krokem

1. Příprava a instalace

  • Nainstalujte GGUF addon pro ComfyUI přes ComfyUI Manager
  • Vytvořte si účet na Hugging Face — budete ho potřebovat ke stahování modelů
  • Stáhněte vybraný Flux.2 Klein GGUF model a text encoder, umístěte je do správných složek

2. Výběr modelu

  • Vyberte požadovaný GGUF soubor Flux.2 Klein (4B nebo 9B) přímo ve workflow
  • Pokud máte silnější GPU, můžete soubory vyměnit za plné unquantizované verze

3. Referenční obrázek a pojmenování postavy

  • Nahrajte jednu čistou referenční fotku vaší postavy
  • Zadejte křestní jméno a příjmení postavy — workflow je použije pro organizaci výstupu

4. Rozměry obrázků

  • Nastavte společné rozměry pro celý dataset (768×1024 je dobrý výchozí bod pro portrét)
  • Stručný návod pro výběr rozměrů je přímo v poznámkové sekci workflow

5. Batche promptů

  • Zadejte instrukce v přirozeném jazyce: „subject seen from the left side", „Make this person wear a blue jacket"
  • V archivu workflow najdete připravené .txt soubory s prompty pro pózy a oblečení
  • Přidejte společné negativní filtry nebo použijte přiložené výchozí hodnoty

6. Sampling a spuštění

  • Nastavte sampling method, CFG a počet kroků — nebo ponechte výchozí hodnoty
  • Stiskněte Run a čekejte — workflow je rychlé
  • Výstup se automaticky uloží do složky output/JmenoPrijmeni/

💾 Prompt Saver — proč je to důležité

Klíčová funkce tohoto workflow je automatické ukládání promptů do čitelných .txt souborů. Každý vygenerovaný obrázek dostane svůj odpovídající textový soubor se všemi metadaty a použitým promptem.

To je zásadní výhoda při trénování LoRA: vaše dataset složka je okamžitě připravena — obrázky a jejich popisy jsou spárované, pojmenované a organizované. Žádné manuální doplňování captionů zpětně.

💡 Tipy pro lepší výsledky

Pro začátečníky

  • Začněte s 6–10 obrázky, ne s 20 — nejprve ověřte kvalitu a konzistenci
  • Referenční fotka by měla být čistá, ideálně bez rušného pozadí
  • Popisujte to, co chcete vidět — ne to, co si představujete
  • Použijte přiložené .txt soubory s připravenými prompty jako výchozí bod

Pro pokročilé

  • Experimentujte s CFG škálou pro různou míru variability výstupů
  • Kombinujte různé sampling metody (DPM++, Euler) pro rozmanitější dataset
  • Část datasetu generujte v jednom stylu osvětlení, část v jiném — trénink ocení diverzitu
  • Pro nejlepší konzistenci používejte Q4 nebo Q8 GGUF verze místo Q2

✅ Shrnutí výhod

  • ✅ Funguje z jediné referenční fotky bez složité přípravy
  • ✅ Přirozený jazyk místo technických promptů — přístupné začátečníkům
  • ✅ Automatické ukládání promptů a metadat = dataset připravený k trénování
  • ✅ Výborné zachování detailů postavy díky architektuře Flux.2 Klein
  • ✅ Běží i na starých AMD GPU s 6–8 GB VRAM
  • ✅ Výrazně rychlejší než starší metody s SDXL nebo standardním Flux

⚠️ Na co si dát pozor

  • ⚠️ Nainstalujte GGUF support přes ComfyUI Manager před spuštěním
  • ⚠️ Potřebujete účet na Hugging Face pro stahování modelů a text encoderů
  • ⚠️ Soubory modelů musí být umístěny ve správných složkách ComfyUI
  • ⚠️ Referenční fotka bez rušného pozadí = lepší a konzistentnější výsledky
  • ⚠️ Model 9B je pouze pro nekomerční použití — pro komerční projekty sáhněte po verzi 4B

📦 Kde workflow najdete

Workflow je dostupné na Civitai od autora Sarcastic TOFU. Aktuálně je v Early Access — brzy bude k dispozici zdarma. Součástí archivu jsou i připravené .txt soubory s prompty pro pózy a outfity, které vám výrazně urychlí celý proces.

Odkaz: civitai.com — Flux.2_Klein_CCDB_v1

← Zpět na tutoriály