When will you grow up?

[이미지 생성 SOTA] Stable Diffusion 3.5 본문

02. Study/Trends

[이미지 생성 SOTA] Stable Diffusion 3.5

미카이 2024. 10. 23. 23:58

10월 22일, 이미지 생성 모델인 SD3.5 ( Stable Diffusion 3.5 ) 모델이 공개되었습니다.

 

Flux 모델이 대부분 사용되는 시점에 stability에서 모델을 발표해서 부라부라 사용후기 및 내용을 간략하게 포스팅을 하게되었다.

 

요약

  Stable Diffusion 3.5는 Stability AI에서 새롭게 선보인 AI 기반 이미지 생성 기술로, 여러 모델 변형을 포함하고 있다. 주요 모델로는 Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo, 그리고 10월 29일에 출시 예정인 Stable Diffusion 3.5 Medium이 있는데 기대가 된다.

 

 

주요 특징 및 개선 사항

모델 변형:
- Stable Diffusion 3.5 Large: 80억 개의 파라미터를 가지고 있으며, 1메가픽셀 해상도에서 뛰어난 품질과 프롬프트 준수성을 제공하여 전문적인 사용에 적합하다고 한다.
- Stable Diffusion 3.5 Large Turbo: Large 모델의 증류 버전으로, 높은 품질의 이미지를 단 네 단계 만에 생성하며 속도가 매우 빠르다.
- Stable Diffusion 3.5 Medium: 10월 29일 출시 예정으로, 향상된 품질, 일관성 및 다중 해상도 생성 기능을 제공합니다.

- 맞춤화 및 접근성: 이 모델들은 매우 맞춤화 가능하며 소비자 하드웨어에서도 효율적으로 구동한다고 합니다. Stability AI 커뮤니티 라이선스 하에 상업적 및 비상업적 용도로 사용할 수 있습니다. 중요한건, Community, Enterprise License가 있는데 1M 달러 기준으로 나뉘는 것 같다. 자세한 내용은 여기를 살펴보자

- Diverse Outputs: 모델은 광범위한 스타일과 미학을 표현하는 이미지를 생성할 수 있으며, 이는 복잡한 프롬프트 없이도 가능하다고 한데 한번 표를 보면서 살펴보자.

 

레딧에 올라온 표를 살펴보면 Flux가 퀄리티면에서는 더 좋은데, SD3.5가 프롬프트 반영은 좀 더 좋은 것 같다. 

 

출처 : https://www.reddit.com/media?url=https%3A%2F%2Fpreview.redd.it%2Fjust-experimented-a-little-with-sd-3-5-large-its-not-bad-v0-zoqqk9ws5cwd1.png%3Fwidth%3D2160%26format%3Dpng%26auto%3Dwebp%26s%3Dba1dfba2a9c9a2a5c4a6fc4ea4f86b43d8a50315

 

 

근데 아마도, 학습 이런 부분에 있어서는 SD 모델류를 따라올게 없어서 LoRA, Dreambooth 등 다양하게 사용될 것 같다.

 

Tutorial

https://stabilityai.notion.site/Stable-Diffusion-3-5-Large-Fine-tuning-Tutorial-11a61cdcd1968027a15bdbd7c40be8c6

 

Stable Diffusion 3.5 Large Fine-tuning Tutorial

Interested in generating images like this from SD3.5 Large?

stabilityai.notion.site

 

 

 

 

자세한 내용은 stability.ai 에서 확인가능합니다.

https://stability.ai/news/introducing-stable-diffusion-3-5 

Comments