전체 일정 및 강좌 설명

2019-06-25
시 간 주 제/강 사/내 용
10:00 ~ 18:30
Part I 자연어처리의 기본
자연어처리의 기본
()

- 자연어처리 개요 : 자연어처리에 대한 정의 및 자연어처리 절차, 최신 동향
- 텍스트 전처리 : 텍스트 데이터를 사용하고자 하는 목적에 맞게 가공하기 위한 토큰화, 어간추출, 불용어 제거, 텍스트 분리 등 텍스트 전처리 기법
- 어휘 분석 : 텍스트 데이터를 의미의 최소단위로 분리하고, 그 최소 단위에 적합한 품사 정보를 할당하기 위한 형태소 분석 등에 대한 이론적 기법
- 문장 분석 : 텍스트 데이터에서 문장의 구조를 분석하기 위한 문법, 구문분석 기법
- 의미 분석 : 문장의 구조적 분석한 결과가 갖는 의미를 분석하기 위한 문장의 의미를 표현하는 방법과 이를 이용한 문장의 해석 방법
- 문맥 분석 : 하나 이상의 문장으로 구성된 텍스트 데이터를 진술, 주장, 추측, 명령, 요청 등 발화의 의도를 분석하고 구분하는 방법
- 딥러닝의 소개 : 최신 핵심 기술로 자리잡고 있는 딥러닝 기법인 CNN, RNN과 자연어 처리에서의 딥러닝 기법의 활용 방안
16:30 ~ 18:30
Part II 다양한 자연어처리 응용
다양한 자연어처리 응용
()

- Named Entity Recognition : 텍스트 데이터에서 객체를 표현하는 단어들을 구분하고, 그 단어에 해당 객체를 의미하는 라벨을 할당하는 기법
- Language Model : 일련의 순서를 가진 텍스트 데이터가 주어졌을 때 다음의 위치할 텍스트 데이터를 확률적으로 예측하는 언어모델과 통계적 기법과 기계학습 기반의 방법론
- Information Extraction : 비정형 텍스트 데이터에서 목적에 맞는 정형화된 텍스를 정보를 추출하는 방법과, 개체명 인식과 개체간의 관계를 표현하는 등의 방법론
- Question & Answering : 질문이 주어졌을 때 그에 해당하는 답변을 자동으로 선택 및 생성하는 방법과 이를 구현하기 위한 규칙기반, 기계학습기반 방법론
- Machine Translation : 입력된 언어를 다른 언어로 바꿔서 출력해주는 방법을 설명하고, 전통적인 기계번역 방법 및 통계기반, 기계학습 기반의 번역 방법론
- Text Generation : 주어진 상황 및 입력 텍스트에 적절할 문장을 생성하는 방법을 설명하고, 기계학습 기반의 방법 및 강화학습 기반의 방법
- Machine Reading Comprehension : 주어진 텍스트 데이터의 문법적, 의미적 맥락을 이해하여 상황에 맞는 답변을 방법을 설명하고, MRC를 위한 자연어 처리 기술 및 평가 방법
- Dialogue System : 사용자와 컴퓨터가 정보를 주고 받는 시스템에 대한 설명과 대화 시스템의 종류 및 대화 시스템 구축 방법
- Text Summarization : 텍스트 데이터의 정보를 컴퓨터가 압축된 문장으로 표현해주는 방법과, 자동 요약의 종류 및 자동 요약 기법
- Text Categorization, Sentiment Analysis : 문서에 포함된 텍스트 데이터를 분석하여 정해진 카테고리에 따라서 분류하는 방법과 텍스트 데이터에서 작성자의 주관적인 의견들을 텍스트로부터 분석해내는 방법과 구현방법
2019-06-26
시 간 주 제/강 사/내 용
10:00 ~ 18:30
Part III 딥러닝 기반의 자연어처리(실습)
딥러닝 기반의 자연어처리(실습)
()

- Colab 툴킷 사용 : Colab은 구글에서 공개한 웹 기반의 python 개발 환경으로 기본적인 사용법과 특징
- 단어 임베딩 : 단어 임베딩은 단어를 벡터로 표현하는 것으로 임베딩 기법의 종류를 설명하고, 기본적인 임베딩 기법
- 딥러닝 기반의 Language Modeling : part II에서 학습한 언어 모델의 일부를 colab을 통해 구현
- 개발 프로젝트 : RNN을 이용한 어절 자동 생성기 개발
- 딥러닝 기반의 한국어 문장 및 문서,감성 분석 : part II에서 배운 sentiment analysis 방법 또는 text categorization 방법을 colab을 통하여 일부 구현
- 개발 프로젝트 : CNN을 이용한 감성분석 또는 문서 분석기 개발