일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- convexhull
- findContours
- python 알고리즘
- 영어명언
- python list
- tensorflow update
- 이미지 생성
- #1일1영어
- c언어
- #프로젝트
- python __init__
- #opencv
- word embedding
- tokenizing
- #실생활영어
- #English
- 딥러닝
- text2img
- keras
- #일상영어
- opencv SURF
- #영어
- #영어 명언
- #실생활 영어
- 영어
- #Android
- TensorFlow
- object detection
- 완전탐색
- Convolution Neural Network
- Today
- Total
목록02. Study/Trends (8)
When will you grow up?
최근에 FLUX 1.1[pro]를 제치고 새로운 강자로 떠오르는 이미지 생성모델이 나왔다. 출저 : https://artificialanalysis.ai/text-to-image Text to Image Models and Providers Leaderboard | Artificial AnalysisAnalysis of Text to Image AI models and providers across quality, generation time and price. Analysis to help you choose the best Text to Image model and provider for your use-case.artificialanalysis.ai 처음에는 red_panda라고 NAME이 나와서..
매년 발생하는 스탠포 AI Index 보고서!!보다보면, 현재 AI 트렌드 및 미래를 생각해볼 수 있다.간략하게 요약해본다. 2024 AI Index 보고서는 인공지능의 사회적, 경제적 영향과 기술적 발전을 분석한 포괄적인 보고서입니다. 이번 보고서에서는 AI 훈련 비용 증가, 생성형 AI 투자 확대, 그리고 책임 있는 AI 개발의 필요성 등을 다룹니다. 주요 내용 요약:1. 기술 성과: AI는 이미지 분류 등에서 인간을 능가하지만, 복잡한 문제 해결 능력은 여전히 부족합니다. 2. 모델 개발: 2023년 산업과 학계의 협력으로 다양한 머신러닝 모델이 탄생했습니다. 3. 훈련 비용: GPT-4 훈련에 약 7,800만 달러가 들었고, Google의 Gemini Ultra에는 1억 9,100만 달러가 투..
10월 22일, 이미지 생성 모델인 SD3.5 ( Stable Diffusion 3.5 ) 모델이 공개되었습니다. Flux 모델이 대부분 사용되는 시점에 stability에서 모델을 발표해서 부라부라 사용후기 및 내용을 간략하게 포스팅을 하게되었다. 요약 Stable Diffusion 3.5는 Stability AI에서 새롭게 선보인 AI 기반 이미지 생성 기술로, 여러 모델 변형을 포함하고 있다. 주요 모델로는 Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo, 그리고 10월 29일에 출시 예정인 Stable Diffusion 3.5 Medium이 있는데 기대가 된다. 주요 특징 및 개선 사항모델 변형: - Stable Diffusion 3..
Yolo 모델이 벌써 11까지 나왔다.Ultralytics에서 지원되는 yolo 모델을 보면 YOLOv3 ~ YOLOv11/ SAM,SAM2, FastSAM, YOLO-World까지 다양한 모델들을 지원한다.아마 많은 사람들이 사용하는 이유중 하나는 간편하게 학습을 할 수 있고 지속적으로 코드 관리는 한다는 점이 있을 것이다. 성능을 살펴보면 기존의 YOLOv10보다 좋은것을 확인할 수 있다 mAP 기준https://github.com/ultralytics/ultralytics YOLO11의 주요 특징향상된 성능: YOLOv8m 대비 22% 적은 매개변수로 더 높은 mAP 점수 달성다양한 작업 지원: 객체 감지, 분류, 포즈 추정, 인스턴스 분할 등개선된 아키텍처: 더 정확한 특징 추출과 처리 속도 ..
요즘 gpu를 대체할 것이라는 얘기가 나오는 cerebras inference를 간단히 살펴보자. CEO 겸 Co-Funder인 Andrew Feldman은 SeaMicro 회사 전 CEO였으며 초고밀도 컴퓨터 서버 산업 회사를 AMD에 엑싯한 경험을 가지고 있는 CEO이다. cerebras.ai 홈페이지를 들어가보면 다음과 같은 문구를 확인할 수 있다. The world’s fastest inference.20x faster than GPUs, 1/5 the cost. Nvidia GPU보다 가격은 1/5 인데, 추론 속도는 20배 빠르다? 이건 못참지! 위 그림을 보면 Llama-3.1-8b 기준으로도 초당 1,837 토큰을 추론한다고한다. 어마어마하다.과연 정말인지 TRY CHAT을 통해 ..
Reddit에 재밌는 글이 있어서 포스팅, https://www.reddit.com/r/StableDiffusion/comments/1exw2m4/sd_31_is_coming/?%24deep_link=true&correlation_id=21f2da84-8060-4063-8f6e-6241a1763d25&post_fullname=t3_1exw2m4&post_index=0&ref=email_digest&ref_campaign=email_digest&ref_source=email&utm_content=post_title&%243p=e_as&_branch_match_id=1285749299433919656&utm_medium=Email+Amazon+SES&_branch_referrer=H4sIAAAAAAAAA2..
항상 웃고있는 Hotshot를 소개합니다.Hotshot은 Text to Video Generation 할 수 있는 비디오 생성기입니다.요즘 핫한 Luma AI, Kling AI 비디오 생성과 대응할 정도로 성능이 나오는 것 같습니다. 구글 아이디로 로그인하면 무료로 하루에 2개의 비디오를 생성할 수 있다고 나온다.아마도 리소스 제한때매 생성횟수 limit을 걸어놓은게 아닐까 싶다. 무료버전이 아닌, Plus 버전을 사용한다면 달마다 99$로 생각보다 비싸게 받고있는 것 같다. 200개 횟수제한도 있는것으로 보인다. ㅠ_ㅠ Hotshot에서는 프롬프트 가이드를 제공하고 있고 간단하게 살펴보자.Hotshot excels at creating videos of people, animals, and n..
요즘 가장 핫한 Flux를 Review해본다.Flux는 blackforestlabs.ai 에서 개발된 모델이다. 모델은 총 3가지를 제공하고 있으며,1. FLUX.1 [schnell]- step 1~4 단계만으로도 고품질 이미지 생성가능- 제일 중요한 apache-2.0 이므로 상업적 목적으로 사용가능- 모델 weight 공개- FLUX 모델 중 가장 빠르게 이미지 생성 가능2. FLUX.1 [dev]- 중간급 성능을 보여주며, FLUX.1 [pro] 와 버금가는 성능이라 나와있다.- 학습시 guidance distillation 이용하면 효율성이 높아진다고 나와있다.- 생성된 출력물은 https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LIC..