Day8 (11.3, 수)
Pororo NER Question Generation 데이터 추가해서 학습
앙상블 재료 만들기
오늘 한 일
1. Pororo NER Question Generation
Wiki 데이터에서 NER 개체를 추출한다. (임의로 10000개 추출)
추출된 NER들 중 조사가 아닌 개체중 하나를 임의로 선택해 answer로 가정하자
선정한 Wiki Context와 임의로 선택한 개체 answer를 가지고 Question Generation을 진행
생성된 Question과 answer의 매핑을 보니 조금 아쉬운 부분이 있어서 다시 질문으로 정답을 생성
sudo 라벨링?
위와 같이 만들어진 데이터로 다시 Reader모델을 학습하여 테스트 진행
bert-base 모델 기준: 0.391 / 0.411 -> 0.473 / 0.521 로 향상됨
2. 앙상블 다양하게 시도하기
보다 다양하게 모델을 구현하고, 새롭게 데이터를 추가하여 생성한 모델로 얻은 결과도 앙상블의 재료로 활용할 수 있었다. 약 50개 남짓의 결과물로부터 다양한 앙상블 테스트를 통해 점수 올리기에 집중!
너무 점수 올리기에 급급한건 아니었는지 싶지만, 신기하게도 자꾸만 오르는 앙상블의 결과를 보면서 신기하고, 왜 그럴지에 대해 고민하게 되었다.
Last updated