일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- python list
- keras
- #영어 명언
- #Android
- Convolution Neural Network
- #English
- #1일1영어
- TensorFlow
- #실생활 영어
- #opencv
- c언어
- 영어명언
- #실생활영어
- convexhull
- object detection
- 딥러닝
- 이미지 생성
- python __init__
- tokenizing
- 완전탐색
- python 알고리즘
- #일상영어
- tensorflow update
- word embedding
- #프로젝트
- #영어
- opencv SURF
- findContours
- 영어
- text2img
- Today
- Total
목록2024/10 (5)
When will you grow up?
최근에 FLUX 1.1[pro]를 제치고 새로운 강자로 떠오르는 이미지 생성모델이 나왔다. 출저 : https://artificialanalysis.ai/text-to-image Text to Image Models and Providers Leaderboard | Artificial AnalysisAnalysis of Text to Image AI models and providers across quality, generation time and price. Analysis to help you choose the best Text to Image model and provider for your use-case.artificialanalysis.ai 처음에는 red_panda라고 NAME이 나와서..
GOT-OCR2.0은 광학 문자 인식(OCR) 분야에 새로운 AI 모델입니다. 이 모델은 기존 OCR 시스템의 한계를 극복하고 문서 처리 능력을 크게 향상시켰습니다. OCR-2.0의 특징- 엔드투엔드 모델: 복잡한 파이프라인 대신 통합된 아키텍처 - 낮은 학습 및 추론 비용: 합리적인 파라미터 수로 효율성 확보 - 다양성: 일반 텍스트뿐만 아니라 수식, 악보, 차트 등 다양한 시각적 "문자" 인식 가능 일단, 그럼 한글 성능을 살펴보자 해당 내용은 나무위키 문서를 캡쳐했다. 입력 plain texts OCR mode 추론 결과 당연히, StepFun, Megvii Technology, University of Chinese Academy of Sciences, Tsinghua University 개발..
매년 발생하는 스탠포 AI Index 보고서!!보다보면, 현재 AI 트렌드 및 미래를 생각해볼 수 있다.간략하게 요약해본다. 2024 AI Index 보고서는 인공지능의 사회적, 경제적 영향과 기술적 발전을 분석한 포괄적인 보고서입니다. 이번 보고서에서는 AI 훈련 비용 증가, 생성형 AI 투자 확대, 그리고 책임 있는 AI 개발의 필요성 등을 다룹니다. 주요 내용 요약:1. 기술 성과: AI는 이미지 분류 등에서 인간을 능가하지만, 복잡한 문제 해결 능력은 여전히 부족합니다. 2. 모델 개발: 2023년 산업과 학계의 협력으로 다양한 머신러닝 모델이 탄생했습니다. 3. 훈련 비용: GPT-4 훈련에 약 7,800만 달러가 들었고, Google의 Gemini Ultra에는 1억 9,100만 달러가 투..
10월 22일, 이미지 생성 모델인 SD3.5 ( Stable Diffusion 3.5 ) 모델이 공개되었습니다. Flux 모델이 대부분 사용되는 시점에 stability에서 모델을 발표해서 부라부라 사용후기 및 내용을 간략하게 포스팅을 하게되었다. 요약 Stable Diffusion 3.5는 Stability AI에서 새롭게 선보인 AI 기반 이미지 생성 기술로, 여러 모델 변형을 포함하고 있다. 주요 모델로는 Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo, 그리고 10월 29일에 출시 예정인 Stable Diffusion 3.5 Medium이 있는데 기대가 된다. 주요 특징 및 개선 사항모델 변형: - Stable Diffusion 3..
NVIDIA, MIT, Tsinghua University 연구진이 공동 연구한 Sana,최대 4096 x 4096 해상도의 이미지를 효율적으로 생성할 수 있는 Text to Image 프레임워크??! 특히, 관심을 많이 가지고 있는 Flux 모델에 비해 100배 빠른 속도로 생성이 가능하고 16G GPU에서도 1024x1024 기준으로 1초 미만으로 이미지를 생성할 수 있다는점! "번역"Sana-0.6B 모델은 최신 대형 확산 모델(예: Flux-12B)과 비교해 20배 작은 크기로 100배 이상 빠른 처리량을 보여줍니다1 . 16GB 노트북 GPU에서 1024 × 1024 해상도 이미지를 1초 미만으로 생성할 수 있습니다 주요 특징은 다음과 같습니다.- 깊은 압축 오토인코더: 기존 8배 압축에서 ..