이미지 생성을 위한 FLUX.1
요즘 가장 핫한 Flux를 Review해본다.
Flux는 blackforestlabs.ai 에서 개발된 모델이다.
모델은 총 3가지를 제공하고 있으며,
1. FLUX.1 [schnell]
- step 1~4 단계만으로도 고품질 이미지 생성가능
- 제일 중요한 apache-2.0 이므로 상업적 목적으로 사용가능
- 모델 weight 공개
- FLUX 모델 중 가장 빠르게 이미지 생성 가능
2. FLUX.1 [dev]
- 중간급 성능을 보여주며, FLUX.1 [pro] 와 버금가는 성능이라 나와있다.
- 학습시 guidance distillation 이용하면 효율성이 높아진다고 나와있다.
- 생성된 출력물은 https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md 라이센스를 참고하여 확인해보시면 좋을 것 같은데 연구 목적이 큰 것 같다.
- 모델 weight 공개
3. FLUX.1 [pro]
- 현재 가장 높은 성능을 보여주는 모델
- API 형태로 제공되며, 모델 공개는 안되어 있다
- 기업 전용 솔루션도 제공
- replicate 기준으로 가격을 살펴보면 $0.055 / image 수준이다.
Flux.1 Model Family
ref : https://blackforestlabs.ai/announcing-black-forest-labs/
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis
Scaling Vision Transformers to 22 Billion Parameters
두 논문 기준으로 모델을 구성하고, 12B 파라미터를 가지고 있다고 한다.
또한,
RoFormer: Enhanced Transformer with Rotary Position Embedding
Scaling Vision Transformers to 22 Billion Parameters
이 두 논문 아이디어를 통합하여 모델 성능을 높이고 하드웨어 효율성을 개선했다고 한다.
정말 멋진 아이디어이다.
향 후 SOTA Text to Video 모델도 Up Next라고 하니 지켜보면 나올것 같다.
팔로업을 위해서는 X에서 팔로우하고 지켜보면 업데이트 내용을 확인할 수 있을 것이다.