Day8 (11.3, 수)

  • Pororo NER Question Generation 데이터 추가해서 학습

  • 앙상블 재료 만들기

오늘 한 일

1. Pororo NER Question Generation

  • Wiki 데이터에서 NER 개체를 추출한다. (임의로 10000개 추출)

  • 추출된 NER들 중 조사가 아닌 개체중 하나를 임의로 선택해 answer로 가정하자

  • 선정한 Wiki Context와 임의로 선택한 개체 answer를 가지고 Question Generation을 진행

  • 생성된 Question과 answer의 매핑을 보니 조금 아쉬운 부분이 있어서 다시 질문으로 정답을 생성

    • sudo 라벨링?

  • 위와 같이 만들어진 데이터로 다시 Reader모델을 학습하여 테스트 진행

bert-base 모델 기준: 0.391 / 0.411 -> 0.473 / 0.521 로 향상됨

2. 앙상블 다양하게 시도하기

보다 다양하게 모델을 구현하고, 새롭게 데이터를 추가하여 생성한 모델로 얻은 결과도 앙상블의 재료로 활용할 수 있었다. 약 50개 남짓의 결과물로부터 다양한 앙상블 테스트를 통해 점수 올리기에 집중!

너무 점수 올리기에 급급한건 아니었는지 싶지만, 신기하게도 자꾸만 오르는 앙상블의 결과를 보면서 신기하고, 왜 그럴지에 대해 고민하게 되었다.

Last updated