오피스아워 (11.10, 수)

1. 스페셜 미션 소개

2. 데이터 제작 (툴 소개)

2.1. 제공되는 원시 말뭉치의 분석 및 문장 선정/정제

Wikipedia 데이터를 어떻게 추출할까?

키워드를 넣고 프로그램을 실행하면 데이터를 추출할 수 있다.

  • 어떤 Article이 있는지 확인하고 어떤 Entity와 Relation이 있을지 확인한다.

  • 제공된 말뭉치를 적절한 길이/내용의 문장으로 나눠야한다.

2.2. 🎇Tagtog을 사용해 초기 Annotation

  • Entity, Relation, (Subject, Object)

2.3. 구글 스프레드시트로 옮기기

3. 퀄리티 있는 RE 데이터 제작을 위한 전략들

관측 가능한 관계들을 리스트업하고 토의를 통해 확정한다.

3.1. Relation Map

  • 토픽에 관한 도메인 지식 활용

  • 이 과정에서 도출이 잘 되지 않는다면 KLUE-RE의 기준을 참고 및 활

3.2. 가이드라인 작성

관계를 정의 - 가능한 관계의 수는 제한되지 않지만, 균등하게 나올수 있는 관계들일수록, 그리고 너무 세부적이지 않은 관계들일수록 실용적인 분류 성능을 기대할 수 있음.

  • 기존 NER에서

Last updated