생성형 AI 스테이블 디퓨전(Stable Diffusion) 소개 및 최소 사양

스테이블 디퓨전은 Stability AI에서 오픈소스 라이선스로 배포한 text-to-image 인공지능 모델입니다. text-to-image는 키워드를 입력하면 키워드를 기반으로 이미지를 그려주는 인공지능입니다. 인터넷 검색을 하면 수많은 생성형 AI 서비스가 있지만 Stable Diffusion은 컴퓨터 사양이 일정 수준을 넘어가면 컴퓨터에 설치하여 누구나 쉽게 체험해 볼 수 있습니다. 여기서는 Stable Diffusion을 설치하기 위한 컴퓨터의 최소 사양을 알아 보려고 합니다.

Stable Diffusion 으로 생성한 가상의 이미지

CPU & RAM

Stable Diffusion은 그래픽 카드(GPU)의 성능이 훨씬 중요하기 때문에 CPU와 RAM의 성능은 크게 중요하지 않습니다. 다만 알고리즘을 처리하는 데 있어 부족하지 않을 정도의 사양이면 충분합니다. CPU의 경우 최소 4 코어 이상이어야 하고 RAM의 경우 16gb 이상이면 충분합니다.

GPU & VRAM

최근 등장한 거의 대부분의 생성형 AI는 그래픽 카드의 성능에 크게 영향을 받습니다. 동일한 알고리즘을 실행한다고 가정하면 Geforce 40xx 시리즈로 작업할 때 10초 이하로 결과물을 받아볼 수 있습니다. 좋은 그래픽 카드를 사용하면 좋겠지만 최소 Geforce 30xx 시리즈의 VRAM이 8gb 이상이면 좋습니다. 추가로 NVIDIA의 그래픽 카드가 Stable Diffusion과 궁합이 좋고 AMD의 그래픽 카드는 불가능한 것은 아니지만 NVIDIA보다 퍼포먼스가 떨어질 수 있습니다.

Stable Diffusion 으로 생성한 가상의 이미지 2

 

AI 시장이 급속도로 발전하고 있기 때문에 현재 시점의 정보가 과거의 정보가 되고 있습니다. 저 역시 생성형 AI와 관련한 기술을 공부하면서 블로그에 작성을 하고 있기 때문에 다소 부족할지 모르겠지만 꾸준히 작성하여 데이터를 쌓아보겠습니다.