Introduction à ComfyUI
Introduction à ComfyUI
Qu'est-ce que ComfyUI ?
ComfyUI est une interface graphique node-based (basée sur des nœuds) pour Stable Diffusion et d'autres modèles de génération d'images par IA. Contrairement aux interfaces classiques comme Automatic1111 qui fonctionnent avec des formulaires, ComfyUI expose l'intégralité du pipeline de génération sous forme de graphe visuel.

Chaque étape du processus — chargement du modèle, encodage du texte, sampling, décodage — est représentée par un nœud que vous connectez aux autres pour créer votre workflow.
Pourquoi choisir ComfyUI ?
Avantages
- Contrôle granulaire : chaque étape du pipeline est visible et configurable
- Workflows réutilisables : sauvegardés en JSON, partageables avec la communauté
- Performance : optimisation mémoire VRAM supérieure aux alternatives
- Extensibilité : des centaines de nœuds custom créés par la communauté
- Transparence : vous voyez exactement ce qui se passe à chaque étape
Comparaison avec les alternatives
| Critère | ComfyUI | Automatic1111 | Fooocus |
|---|---|---|---|
| Interface | Nœuds visuels | Formulaire web | Formulaire simplifié |
| Courbe d'apprentissage | Moyenne | Facile | Très facile |
| Flexibilité | Maximale | Bonne | Limitée |
| Performance VRAM | Excellente | Bonne | Bonne |
| Workflows custom | Oui (natif) | Via scripts | Non |
| Communauté | Très active | Très active | Active |
Les concepts fondamentaux
Le graphe de nœuds
Dans ComfyUI, tout est un nœud. Un nœud prend des entrées (inputs), effectue un traitement, et produit des sorties (outputs). Les sorties d'un nœud se connectent aux entrées d'un autre via des liens (edges).
[Entrée A] ──► [Nœud de traitement] ──► [Sortie]
[Entrée B] ──►
Les types de données
Les connexions entre nœuds transportent différents types de données, identifiés par des couleurs :
| Couleur | Type | Description |
|---|---|---|
| Violet | MODEL | Le modèle de diffusion (checkpoint) |
| Jaune | CLIP | L'encodeur de texte |
| Rose | VAE | Le décodeur d'images latentes |
| Orange | CONDITIONING | Le prompt encodé (positif ou négatif) |
| Rose clair | LATENT | L'image dans l'espace latent |
| Vert | IMAGE | L'image finale en pixels |
Le workflow de base (text-to-image)
Le workflow le plus simple pour générer une image à partir de texte utilise ces nœuds :
- Load Checkpoint — charge le modèle (.safetensors) et expose MODEL, CLIP et VAE
- CLIP Text Encode (positive) — encode votre prompt positif
- CLIP Text Encode (negative) — encode votre prompt négatif
- Empty Latent Image — crée un canvas vide à la résolution souhaitée
- KSampler — le cœur du processus : effectue le débruitage itératif
- VAE Decode — convertit le résultat latent en image visible
- Save Image — sauvegarde le résultat sur le disque
Load Checkpoint ──► CLIP Text Encode (+) ──►
──► CLIP Text Encode (-) ──► KSampler ──► VAE Decode ──► Save Image
──► Empty Latent Image ──────►
L'interface de ComfyUI
Navigation
- Clic gauche : sélectionner un nœud
- Clic droit sur le canvas : ouvrir le menu d'ajout de nœuds
- Molette : zoomer / dézoomer
- Clic milieu + drag : se déplacer dans le canvas
- Ctrl + S : sauvegarder le workflow
- Ctrl + Z : annuler
Le panneau de contrôle
En bas de l'écran, vous trouvez :
- Queue Prompt : lance la génération (ou appuyez sur Entrée)
- Queue Size : nombre d'images en file d'attente
- Auto Queue : génère en continu automatiquement
Gestion des nœuds
- Clic droit sur un nœud → options (Mute, Bypass, Collapse, Convert to Group)
- Mute : désactive un nœud sans le supprimer (pratique pour tester)
- Bypass : le nœud transmet ses entrées sans traitement
- Group : regrouper visuellement des nœuds liés
Les modèles de diffusion
Stable Diffusion 1.5
Le modèle historique, léger et rapide. Résolution native : 512x512. Idéal pour débuter et expérimenter.
SDXL (Stable Diffusion XL)
Amélioration majeure avec une résolution native de 1024x1024. Meilleure qualité, meilleur suivi des prompts, mais plus gourmand en VRAM.
Flux
Développé par Black Forest Labs (les créateurs de Stable Diffusion), Flux représente la nouvelle génération. Excellent rendu du texte dans les images et qualité photoréaliste.
Comment choisir ?
- Débutant / GPU modeste : SD 1.5
- Qualité / GPU correct (8 Go+) : SDXL
- Meilleure qualité / GPU puissant (12 Go+) : Flux
Ressources et communauté
- GitHub officiel : le dépôt principal de ComfyUI
- ComfyUI Manager : gestionnaire d'extensions incontournable
- CivitAI : plateforme de partage de modèles, LoRAs et workflows
- Reddit r/comfyui : communauté active pour l'entraide
- OpenArt : bibliothèque de workflows ComfyUI prêts à l'emploi