Introduction à ComfyUI

Qu'est-ce que ComfyUI ?

ComfyUI est une interface graphique node-based (basée sur des nœuds) pour Stable Diffusion et d'autres modèles de génération d'images par IA. Contrairement aux interfaces classiques comme Automatic1111 qui fonctionnent avec des formulaires, ComfyUI expose l'intégralité du pipeline de génération sous forme de graphe visuel.

Interface de ComfyUI

Chaque étape du processus — chargement du modèle, encodage du texte, sampling, décodage — est représentée par un nœud que vous connectez aux autres pour créer votre workflow.

Pourquoi choisir ComfyUI ?

Avantages

Contrôle granulaire : chaque étape du pipeline est visible et configurable
Workflows réutilisables : sauvegardés en JSON, partageables avec la communauté
Performance : optimisation mémoire VRAM supérieure aux alternatives
Extensibilité : des centaines de nœuds custom créés par la communauté
Transparence : vous voyez exactement ce qui se passe à chaque étape

Comparaison avec les alternatives

Critère	ComfyUI	Automatic1111	Fooocus
Interface	Nœuds visuels	Formulaire web	Formulaire simplifié
Courbe d'apprentissage	Moyenne	Facile	Très facile
Flexibilité	Maximale	Bonne	Limitée
Performance VRAM	Excellente	Bonne	Bonne
Workflows custom	Oui (natif)	Via scripts	Non
Communauté	Très active	Très active	Active

Les concepts fondamentaux

Le graphe de nœuds

Dans ComfyUI, tout est un nœud. Un nœud prend des entrées (inputs), effectue un traitement, et produit des sorties (outputs). Les sorties d'un nœud se connectent aux entrées d'un autre via des liens (edges).

[Entrée A] ──► [Nœud de traitement] ──► [Sortie]
[Entrée B] ──►

Les types de données

Les connexions entre nœuds transportent différents types de données, identifiés par des couleurs :

Couleur	Type	Description
Violet	MODEL	Le modèle de diffusion (checkpoint)
Jaune	CLIP	L'encodeur de texte
Rose	VAE	Le décodeur d'images latentes
Orange	CONDITIONING	Le prompt encodé (positif ou négatif)
Rose clair	LATENT	L'image dans l'espace latent
Vert	IMAGE	L'image finale en pixels

Le workflow de base (text-to-image)

Le workflow le plus simple pour générer une image à partir de texte utilise ces nœuds :

Load Checkpoint — charge le modèle (.safetensors) et expose MODEL, CLIP et VAE
CLIP Text Encode (positive) — encode votre prompt positif
CLIP Text Encode (negative) — encode votre prompt négatif
Empty Latent Image — crée un canvas vide à la résolution souhaitée
KSampler — le cœur du processus : effectue le débruitage itératif
VAE Decode — convertit le résultat latent en image visible
Save Image — sauvegarde le résultat sur le disque

Load Checkpoint ──► CLIP Text Encode (+) ──►
                ──► CLIP Text Encode (-) ──► KSampler ──► VAE Decode ──► Save Image
                ──► Empty Latent Image ──────►

L'interface de ComfyUI

Navigation

Clic gauche : sélectionner un nœud
Clic droit sur le canvas : ouvrir le menu d'ajout de nœuds
Molette : zoomer / dézoomer
Clic milieu + drag : se déplacer dans le canvas
Ctrl + S : sauvegarder le workflow
Ctrl + Z : annuler

Le panneau de contrôle

En bas de l'écran, vous trouvez :

Queue Prompt : lance la génération (ou appuyez sur Entrée)
Queue Size : nombre d'images en file d'attente
Auto Queue : génère en continu automatiquement

Gestion des nœuds

Clic droit sur un nœud → options (Mute, Bypass, Collapse, Convert to Group)
Mute : désactive un nœud sans le supprimer (pratique pour tester)
Bypass : le nœud transmet ses entrées sans traitement
Group : regrouper visuellement des nœuds liés

Les modèles de diffusion

Stable Diffusion 1.5

Le modèle historique, léger et rapide. Résolution native : 512x512. Idéal pour débuter et expérimenter.

SDXL (Stable Diffusion XL)

Amélioration majeure avec une résolution native de 1024x1024. Meilleure qualité, meilleur suivi des prompts, mais plus gourmand en VRAM.

Flux

Développé par Black Forest Labs (les créateurs de Stable Diffusion), Flux représente la nouvelle génération. Excellent rendu du texte dans les images et qualité photoréaliste.

Comment choisir ?

Débutant / GPU modeste : SD 1.5
Qualité / GPU correct (8 Go+) : SDXL
Meilleure qualité / GPU puissant (12 Go+) : Flux

Ressources et communauté

GitHub officiel : le dépôt principal de ComfyUI
ComfyUI Manager : gestionnaire d'extensions incontournable
CivitAI : plateforme de partage de modèles, LoRAs et workflows
Reddit r/comfyui : communauté active pour l'entraide
OpenArt : bibliothèque de workflows ComfyUI prêts à l'emploi