일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 완전탐색
- TensorFlow
- c언어
- 딥러닝
- python list
- tensorflow update
- #Android
- #opencv
- #실생활영어
- #실생활 영어
- 이미지 생성
- #English
- #일상영어
- tokenizing
- #영어 명언
- python 알고리즘
- Convolution Neural Network
- #프로젝트
- text2img
- keras
- convexhull
- 영어
- opencv SURF
- object detection
- 영어명언
- #영어
- findContours
- python __init__
- word embedding
- #1일1영어
Archives
- Today
- Total
When will you grow up?
GPU보다 20배 추론 속도를 가진 Cerebras 본문
요즘 gpu를 대체할 것이라는 얘기가 나오는 cerebras inference를 간단히 살펴보자.
CEO 겸 Co-Funder인 Andrew Feldman은 SeaMicro 회사 전 CEO였으며 초고밀도 컴퓨터 서버 산업 회사를 AMD에 엑싯한 경험을 가지고 있는 CEO이다.
cerebras.ai 홈페이지를 들어가보면 다음과 같은 문구를 확인할 수 있다.
The world’s fastest inference.
20x faster than GPUs, 1/5 the cost.
Nvidia GPU보다 가격은 1/5 인데, 추론 속도는 20배 빠르다? 이건 못참지!
위 그림을 보면 Llama-3.1-8b 기준으로도 초당 1,837 토큰을 추론한다고한다. 어마어마하다.
과연 정말인지 TRY CHAT을 통해 사용해보자.
위 이미지는 70b 기준으로도 정말 빠른 답변을 해주는것을 확인할 수 있다. 만약 GPT 계열 말고 Diffusion 계열도 지원한다고하면 정말 빠르게 이미지 생성, 동영상 생성하여 현업에서도 많이 도입될 수 있을거라 생각된다.
현재 지원되는 모델 리스트는 다음 Github에서 확인할 수 있다.
https://github.com/Cerebras/modelzoo
'02. Study > Trends' 카테고리의 다른 글
[이미지 생성 SOTA] Stable Diffusion 3.5 (0) | 2024.10.23 |
---|---|
Object Detection SOTA 모델 Ultralytics YOLO11 (2) | 2024.09.30 |
Stable Diffusion 3.1 Coming Soon? (0) | 2024.08.24 |
Hotshot : AI Video Generator (0) | 2024.08.23 |
이미지 생성을 위한 FLUX.1 (0) | 2024.08.17 |
Comments