(7강) BERT 언어모델 기반의 문장 토큰 분류
Last updated
Last updated
각 토큰에 대한 라벨을 예측하는 분류 모델 POS-tagging, NER에서 활용 됨.
[Reference]
개체명 인식 1. Named Entity Recognition (NER) for Turkish with BERT
QA 1. lonformer_qa_training.ipynb 2. [논문리뷰] Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
BERT seq2seq 1. BERT2BERT_for_CNN_Dailymail.ipynb 2. Bert2Bert Summarization
주어진 문장의 각 token이 어떤 범주에 속하는지 분류하는 task
개체명 인식은 문맥을 파악해서 인명, 지명 등의 분류를 하는 Task
한국 해양대학교 자연어 처리 연구실에서 공개한 한국어 NER 데이터
특히 한국어를 토큰화할때는 음절단위로 하는것을 추천한다.