일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 완전탐색
- findContours
- Convolution Neural Network
- #1일1영어
- convexhull
- 영어명언
- #opencv
- tensorflow update
- #프로젝트
- #Android
- 딥러닝
- word embedding
- #일상영어
- python 알고리즘
- #English
- 영어
- #영어 명언
- c언어
- python __init__
- tokenizing
- opencv SURF
- python list
- 이미지 생성
- TensorFlow
- #실생활영어
- #실생활 영어
- text2img
- #영어
- keras
- object detection
- Today
- Total
목록tokenizing (2)
When will you grow up?

Natural Language Tokenizing - 텍스트에 대한 정보를 단위별로 나눈 것이 일반적이며, - 기본 단위로 자르는 것을 Tokenizing이라고 한다. English tokenizing library : NLTK, Spacy가 가장 많이 사용되며, 영어 텍스트에 대해 전처리 및 분석을 위한 도구로 유명 Window 10, Anaconda 환경을 기준 python 3.7을 사용한다. 설치 pip install nltk 1 2 import nltk nltk.download() http://colorscripter.com/info#e" target="_blank" style="text-decoration:none;color:white">cs all-corpora 텍스트 언어 분석을 위한 말뭉치..
자연어 처리(natural language processing) NLP라고 불리며, 컴퓨터가 자연어의 의미를 분석하여 처리할 수 있도록 하는 과정이다. 크게 자연어 전처리, 학습, 활용 분야로 나뉠수 있다. 자연어 전처리 (natural language preprocessing) - 자연어 tokenizing : 형태소 분석, 단어 or 문장으로 나누기 등 - 단어 Indexing : dictionary 만들기 등 - 단어 representation : One hot encoding, Word Embedding, Word2Vec 등 학습 (Training) - ANN (Artificial Neural Network) - DNN (Deep Neural Network) - RNN (Recurrent Neur..