When will you grow up?

이미지 생성을 위한 FLUX.1 본문

02. Study/Trends

이미지 생성을 위한 FLUX.1

미카이 2024. 8. 17. 23:55

요즘 가장 핫한 Flux를 Review해본다.

Flux는 blackforestlabs.ai 에서 개발된 모델이다.

 

 

모델은 총 3가지를 제공하고 있으며,

1. FLUX.1 [schnell]

- step 1~4 단계만으로도 고품질 이미지 생성가능

- 제일 중요한 apache-2.0 이므로 상업적 목적으로 사용가능

- 모델 weight 공개

- FLUX 모델 중 가장 빠르게 이미지 생성 가능

2. FLUX.1 [dev]

- 중간급 성능을 보여주며, FLUX.1 [pro] 와 버금가는 성능이라 나와있다.

- 학습시 guidance distillation 이용하면 효율성이 높아진다고 나와있다.

- 생성된 출력물은 https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md 라이센스를 참고하여 확인해보시면 좋을 것 같은데 연구 목적이 큰 것 같다.

- 모델 weight 공개

3. FLUX.1 [pro]

- 현재 가장 높은 성능을 보여주는 모델

- API 형태로 제공되며, 모델 공개는 안되어 있다

- 기업 전용 솔루션도 제공

- replicate 기준으로 가격을 살펴보면 $0.055 / image 수준이다.

 

 

 

Flux.1 Model Family

ref : https://blackforestlabs.ai/announcing-black-forest-labs/

 

 

 

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Scaling Vision Transformers to 22 Billion Parameters

두 논문 기준으로 모델을 구성하고, 12B 파라미터를 가지고 있다고 한다.

 

또한,

RoFormer: Enhanced Transformer with Rotary Position Embedding

Scaling Vision Transformers to 22 Billion Parameters

이 두 논문 아이디어를 통합하여 모델 성능을 높이고 하드웨어 효율성을 개선했다고 한다.

 

정말 멋진 아이디어이다.

 

 

향 후 SOTA Text to Video 모델도 Up Next라고 하니 지켜보면 나올것 같다.

 

팔로업을 위해서는 X에서 팔로우하고 지켜보면 업데이트 내용을 확인할 수 있을 것이다.

https://x.com/bfl_ml

Comments