When will you grow up?

Notice

Recent Posts

Recent Comments

Link

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

Today

Total

관리 메뉴

When will you grow up?

Natural Language Tokenizing (KoNLPy)

Korean tokenizing library : 파이썬 한국어 형태소 분석 라이브러리인 KoNLPy 가많이 사용되며, 설치하면 한나눔, 꼬꼬마, 트위터 등의 형태소 분석기를 쉽게 사용 가능. Window 10, Anaconda 환경을 기준 python 3.7을 사용한다. KoNLPy 설치 - 설치 전 java와 Jpype를 다운받고 설치해야한다. 1. Java 1.7 이상 설치 https://www.oracle.com/technetwork/java/javase/downloads/jdk12-downloads-5295953.html 에 접속 후 운영체제에 맞는 jdk 다운 및 설치 (window 10 이라 맨 아래의 것으로 다운 받았다) 2. 설치 후 JAVA_HOME Path 설정 내컴퓨터 오른쪽버튼 속..

02. Study/Deep Learning 2019. 8. 5. 22:35

Natural Language Tokenizing (NLTK)

Natural Language Tokenizing - 텍스트에 대한 정보를 단위별로 나눈 것이 일반적이며, - 기본 단위로 자르는 것을 Tokenizing이라고 한다. English tokenizing library : NLTK, Spacy가 가장 많이 사용되며, 영어 텍스트에 대해 전처리 및 분석을 위한 도구로 유명 Window 10, Anaconda 환경을 기준 python 3.7을 사용한다. 설치 pip install nltk 1 2 import nltk nltk.download() http://colorscripter.com/info#e" target="_blank" style="text-decoration:none;color:white">cs all-corpora 텍스트 언어 분석을 위한 말뭉치..

02. Study/Deep Learning 2019. 8. 5. 22:10

자연어 처리(natural language processing)

자연어 처리(natural language processing) NLP라고 불리며, 컴퓨터가 자연어의 의미를 분석하여 처리할 수 있도록 하는 과정이다. 크게 자연어 전처리, 학습, 활용 분야로 나뉠수 있다. 자연어 전처리 (natural language preprocessing) - 자연어 tokenizing : 형태소 분석, 단어 or 문장으로 나누기 등 - 단어 Indexing : dictionary 만들기 등 - 단어 representation : One hot encoding, Word Embedding, Word2Vec 등 학습 (Training) - ANN (Artificial Neural Network) - DNN (Deep Neural Network) - RNN (Recurrent Neur..

02. Study/Deep Learning 2019. 8. 5. 21:36

Prev 1 ··· 19 20 21 22 23 24 25 ··· 61 Next

When will you grow up?

티스토리툴바