Écoutez cet article

Stable Diffusion est un générateur d’images alimenté par l’IA très populaire que vous pouvez exécuter sur votre propre PC. Mais quelles sont les spécifications minimales pour faire fonctionner Stable Diffusion, et quels sont les composants les plus importants ?

Table des matières

De quel matériel PC Stable Diffusion a-t-elle besoin ?

Le composant le plus critique pour Stable Diffusion est votre carte graphique (GPU). Stable Diffusion, du moins la version principale, fonctionne presque exclusivement sur votre GPU. Cela signifie que les autres composants du système, comme le processeur, la mémoire vive et les disques de stockage, n’ont pas autant d’importance.

LA DIFFUSION STABLE 2 EST LÀ, MAIS TOUT LE MONDE N’EST PAS HEUREUX

D’une manière générale, voici les spécifications minimales que nous recommandons si vous construisez un nouveau PC avec Stable Diffusion en tête :

CPU : Tout processeur moderne AMD ou Intel.
RAM : Un minimum de 16 gigaoctets de RAM DDR4 ou DDR5.
Stockage : Tout lecteur à semi-conducteurs SATA ou NVMe d'une entreprise réputée, d'une capacité de 256 gigaoctets ou plus. Vous avez besoin d'au moins 10 gigaoctets d'espace libre disponible. Généralement, les disques d'un téraoctet offrent le meilleur prix par gigaoctet de stockage.
GPU : Tout GPU GeForce RTX avec un minimum de 8 gigaoctets de mémoire GDDR6.

De quel type de carte graphique (GPU) avez-vous besoin pour exécuter Stable Diffusion ?

La communauté de la diffusion stable a travaillé assidûment pour élargir le nombre de périphériques sur lesquels la diffusion stable peut fonctionner. Nous avons vu la diffusion stable fonctionner sur des Macs M1 et M2, des cartes AMD et de vieilles cartes NVIDIA, mais elles ont tendance à être difficiles à faire fonctionner et sont plus sujettes à des problèmes. Les GPU NVIDIA RTX sont les seuls supportés en natif par Stable Diffusion au moment où cet article a été écrit, en décembre 2022.

N’importe laquelle des cartes NVIDIA RTX suivantes fonctionnera dès la sortie de la boîte :

RTX 2060 (12 Go), RTX 2070, RTX 2070 Super, RTX 2080, RTX 2080 Super, RTX 2080 Ti ou RTX Titan.
RTX 3060, RTX 3060 Ti, RTX 3070, RTX 3070 Ti, RTX 3080, RTX 3080 (12GB), RTX 3080 Ti, RTX 3090, ou RTX 3090 Ti
RTX 4090, RTX 4080, et futurs GPU de la série 40

Essayez d’acheter le GPU le plus récent que vous pouvez. N’importe lequel des GPU NVIDIA des séries 20, 30 ou 40 avec 8 gigaoctets de mémoire fonctionnera, mais les GPU plus anciens, même avec la même quantité de RAM vidéo (VRAM), mettront plus de temps à produire une image de même taille. Si vous construisez ou mettez à niveau un PC en vue d’une diffusion stable, évitez les anciens GPU RTX série 20, à moins que vous ne fassiez une bonne affaire, car ils sont nettement plus lents.

De quelle quantité de mémoire vidéo (mémoire du GPU) avez-vous besoin ?

Plus vos images sont grandes, plus la VRAM utilisée par Stable Diffusion sera importante. La quantité minimale de VRAM que vous devriez considérer est de 8 gigaoctets.

La version non modifiée de Stable Diffusion produira des images 256×256 en utilisant 8 Go de VRAM, mais vous aurez probablement des problèmes en essayant de produire des images 512×512. Si vous voulez passer à des images 512×512 sans avoir à manipuler les paramètres, procurez-vous un GPU avec 12 gigaoctets de VRAM ou plus.

Le RTX 3060 est une option potentielle à un prix relativement bas. La RTX 3060 est plus lente que la 3060 Ti, mais la RTX 3060 a 12 gigaoctets de VRAM, alors que la 3080 Ti n’en a que 8. La VRAM supplémentaire va vraiment briller en diffusion stable, mais cela se fait au détriment de la vitesse et des performances de jeu.

Quand il s’agit de VRAM supplémentaire et de Stable Diffusion, le ciel est la limite – Stable Diffusion utilisera volontiers chaque gigaoctet de VRAM disponible sur une RTX 4090. Tout dépend de la taille de l’image que vous générez.

Bien sûr, il existe toutes sortes de forks optimisés qui vous permettent de vous en sortir avec beaucoup moins de VRAM au détriment de la vitesse, mais si vous voulez être sûr que cela fonctionnera, tenez-vous en aux cartes RTX NVIDIA qui ont au moins 8 gigaoctets de mémoire.

Faut-il utiliser une fourchette optimisée de diffusion stable ?

En un mot : oui.

La communauté de Stable Diffusion a fait un travail fantastique en élargissant le nombre de GPU pris en charge pour rendre Stable Diffusion plus accessible.

Les forks de la communauté incluent souvent une interface utilisateur, des modèles supplémentaires pour affiner vos créations, et des optimisations qui vous permettent de générer des images plus grandes avec moins de VRAM. Certains utilisateurs ont été en mesure de générer des images 512×512 avec seulement 4 gigaoctets de VRAM en utilisant les forks communautaires. Ces mêmes optimisations permettent aux utilisateurs disposant de GPU de 8 et 12 gigaoctets de produire des images beaucoup plus grandes.

L’interface utilisateur est également une excellente fonctionnalité, car elle facilite l’utilisation de Stable Diffusion.

Mais attention. La plupart des modifications que vous trouverez sont écrites par des passionnés bien intentionnés, mais il est toujours possible que quelqu’un agisse de manière malveillante. Si votre antivirus signale une bifurcation de Diffusion Stable comme malveillante, ne l’ignorez pas. Stable Diffusion n’est pas connu pour produire des faux positifs de la part des logiciels antivirus, donc tout avertissement que vous recevez doit être pris au sérieux.

Une fois que vous avez le bon matériel, vous pouvez passer du temps à optimiser vos invites de diffusion stable au lieu de votre PC.