오피스아워 (11.10, 수)
1. 스페셜 미션 소개
2. 데이터 제작 (툴 소개)
2.1. 제공되는 원시 말뭉치의 분석 및 문장 선정/정제
Wikipedia 데이터를 어떻게 추출할까?
키워드를 넣고 프로그램을 실행하면 데이터를 추출할 수 있다.
어떤 Article이 있는지 확인하고 어떤 Entity와 Relation이 있을지 확인한다.
제공된 말뭉치를 적절한 길이/내용의 문장으로 나눠야한다.
2.2. 🎇Tagtog을 사용해 초기 Annotation
Entity, Relation, (Subject, Object)
2.3. 구글 스프레드시트로 옮기기
3. 퀄리티 있는 RE 데이터 제작을 위한 전략들
관측 가능한 관계들을 리스트업하고 토의를 통해 확정한다.
3.1. Relation Map
토픽에 관한 도메인 지식 활용
이 과정에서 도출이 잘 되지 않는다면 KLUE-RE의 기준을 참고 및 활
3.2. 가이드라인 작성
관계를 정의 - 가능한 관계의 수는 제한되지 않지만, 균등하게 나올수 있는 관계들일수록, 그리고 너무 세부적이지 않은 관계들일수록 실용적인 분류 성능을 기대할 수 있음.
기존 NER에서
Last updated