일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- object detection
- 영어명언
- #일상영어
- #Android
- TensorFlow
- c언어
- #English
- #영어
- tensorflow update
- convexhull
- python list
- #opencv
- findContours
- #1일1영어
- #프로젝트
- 완전탐색
- word embedding
- opencv SURF
- tokenizing
- #실생활영어
- 딥러닝
- python __init__
- 영어
- #실생활 영어
- keras
- Convolution Neural Network
- text2img
- #영어 명언
- 이미지 생성
- python 알고리즘
- Today
- Total
목록02. Study/Deep Learning (10)
When will you grow up?
최근 컴퓨터 조립으로 rtx 3000 series를 window 환경에서 setting을 하게되었다. 일단, pytorch 및 tensorflow gpu동작이 잘 되는것을 확인하였는데, 이 글을 통해 향 후 셋팅하면서 수고스러운일을 덜기 위해 작성한다. GPU 는 RTX3090 기준으로 작성되었습니다. 1. Anaconda 설치 -> 최신 anaconda 대신 나는 이전 버전을 설치하였다 repo.anaconda.com/archive/ -> Anaconda3-2020.02-Windows-x86_64 검색해서 다운받을 수 있다. 2. CUDA 및 cudnn 설치 -> 이 부분이 gpu 사용을 위해 가장 중요한데, 2.1) CUDA ->CUDA Toolkit 11.1.1 -> 파일명(cuda_11.1.1_4..
워드 클라우드 (wordcloud) - 특정 데이터나 텍스트에 자주 등장하는 핵심단어 시각화 text : https://ko.wikipedia.org/wiki/%EC%9E%90%EC%97%B0%EC%96%B4_%EC%B2%98%EB%A6%AC wordcloud 모듈 설치 1 pip install wordcloud ex1 word cloud basic) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 import matplotlib.pyplot as plt %matplotlib inline from wordcloud import WordCloud, STOPWORDS t..
단어 임베딩(Word Embedding) - 단어 벡터 사이에 추상적이고 기하학적인 관계를 얻으려면 단어 사이에 있는 의미 관계를 반영해야되는데, 단어 임베딩은 언어를 기하학적 공간에 매핑하는 것이다. ex) 임베딩 공간에서는 동의어가 비슷한 단어 벡터로 임베딩. 즉, 멀리 떨어진 위치의 단어는 서로 의미가 다르며 거리 외에 공간의 특정 방향도 의미를 가질 수 있다. - 기하학적 변환은 ('king'벡터) + ('female'벡터) = ('queen'벡터) / ('서울') + ('중국') - ('한국') = ('베이징') 단어 임베딩 공간은 전형적으로 위와 같은 해석이 가능하고 잠재적으로 유용한 고차원 벡터를 특성으로 가진다. Word2Vec - 각 단어를 임베딩이라고 부르는 작고 밀집된 벡터(ex-10..
단어 사전(word index) : 숫자 매핑 사전 만들기. 즉, 단어별로 인덱스를 부여하는 것이다. keras에서 제공되는 preprocessing을 이용하면 간단하게 구현해볼 수 있다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 from keras import preprocessing samples = ['현재날씨는 10분 단위로 갱신되며, 날씨 아이콘은 강수가 있는 경우에만 제공됩니다.', '낙뢰 예보는 초단기예보에서만 제공됩니다.', '나 좋은 일이 생겼어', '아 오늘 진짜 짜증나' ] tokenizer = preprocessing.text.Tokenizer() tokenizer.fit_on_texts(samples) word_index = tokenizer.word_ind..
Korean tokenizing library : 파이썬 한국어 형태소 분석 라이브러리인 KoNLPy 가많이 사용되며, 설치하면 한나눔, 꼬꼬마, 트위터 등의 형태소 분석기를 쉽게 사용 가능. Window 10, Anaconda 환경을 기준 python 3.7을 사용한다. KoNLPy 설치 - 설치 전 java와 Jpype를 다운받고 설치해야한다. 1. Java 1.7 이상 설치 https://www.oracle.com/technetwork/java/javase/downloads/jdk12-downloads-5295953.html 에 접속 후 운영체제에 맞는 jdk 다운 및 설치 (window 10 이라 맨 아래의 것으로 다운 받았다) 2. 설치 후 JAVA_HOME Path 설정 내컴퓨터 오른쪽버튼 속..
Natural Language Tokenizing - 텍스트에 대한 정보를 단위별로 나눈 것이 일반적이며, - 기본 단위로 자르는 것을 Tokenizing이라고 한다. English tokenizing library : NLTK, Spacy가 가장 많이 사용되며, 영어 텍스트에 대해 전처리 및 분석을 위한 도구로 유명 Window 10, Anaconda 환경을 기준 python 3.7을 사용한다. 설치 pip install nltk 1 2 import nltk nltk.download() http://colorscripter.com/info#e" target="_blank" style="text-decoration:none;color:white">cs all-corpora 텍스트 언어 분석을 위한 말뭉치..
자연어 처리(natural language processing) NLP라고 불리며, 컴퓨터가 자연어의 의미를 분석하여 처리할 수 있도록 하는 과정이다. 크게 자연어 전처리, 학습, 활용 분야로 나뉠수 있다. 자연어 전처리 (natural language preprocessing) - 자연어 tokenizing : 형태소 분석, 단어 or 문장으로 나누기 등 - 단어 Indexing : dictionary 만들기 등 - 단어 representation : One hot encoding, Word Embedding, Word2Vec 등 학습 (Training) - ANN (Artificial Neural Network) - DNN (Deep Neural Network) - RNN (Recurrent Neur..
Transfer Learning이란?- 일반적으로 우리가 사용하는 Deep Learning에서 여러가지 문제점이 존재할 수 있다.흔한경우를 보면, 학습시켜야할 데이터수가 적을수도 있고, 충분한 학습을 위한 서버컴퓨터가 없을수도 있다. 여러가지 이유가 존재하겠지만,그래서 일반적으로 VGG,ResNet,gooGleNet등 이미 이러한 사전에 학습이 완료된 모델(Pre-Training Model)을 가지고 우리가 원하는 학습에 미세 조정 즉, 작은변화를 이용하여 학습시키는 방법이 Transfer Learning이다. 이야기하자면, 이미학습된 weight들을 transfer(전송)하여 자신의 model에 맞게 학습을 시키는 방법입니다. Keras에서는 이미 학습된 주요 모델들을 간편하게 제공합니다. 123456..
이번시간에는,Keras를 이용하여 IMDB dataset으로 NLP학습을 해보겠습니다.IMDB dataset은 스탠포드 연구원에 의해 수집되었으며,Large Movie Review Sentence dataset고, 문장에 따라 good(긍정) / bad(부정)으로 나뉘는 Label이 되어 있습니다. Keras로 IMDB 데이터셋을 불러오면training용 Data 25000 / test용 Data 25000로 구성이 되어있습니다.1234from keras.datasets import imdb #load the dataset(x_train, y_train), (x_test, y_test) = imdb.load_data()cs word Embedding 이란?- 자연어 처리 분야(NLP)에서 학습을 할 수 ..
Perceptron Learning Algorithm?->McCulloch와 Pitts(1943)가 제안한 인공 신경망으로, 여기에서 학습은 입력된 패턴을 한 번에 하나씩 비교하면서 요구된 출력이 일어날 때까지 가중치를 조절하는 과정을 통해 일어난다. 일련의 입력들에 대하여 가중치를 부여한 레이어로 구성되어 있다[네이버 지식백과] 퍼셉트론 학습 [perceptron learning] (실험심리학용어사전, 2008., 시그마프레스㈜) -Python Code12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061import matplotlib.pyplot as p..