Day2(2.15, 화)

TO-DO

  • Proro 모델 추론하기

  • 데이터 추가하기(KLUE dev데이터)

Today's Work

1. Proro 모델 추론하기

과거 대화요약에서도 굉장히 좋은성능을 내는 모델이었던만큼 큰 기대를 가지고 추론을 돌려보았다.

class도 똑같아서 그냥 돌리기만하면됨...

  • Accuracy: 0.817점 106등/400명

  • 최고점이 0.905점으로 꽤 괜찮은 성능을 확인할 수 있었다.

  • 아무래도 KLUE 데이터 셋으로 만든 Test데이터셋이다보니 주어진 데이터로 학습한 모델이 더 좋은 성능을 낼 것 같다.

2. 데이터 추가하기

KLUE의 Dev데이터 3000건을 학습데이터 셋으로 추가하였다.

후기

오늘은 다른 공부와 면접준비를 하면서 많은 실험을 하지 못하였다. 내일은 허깅페이스 모델을 활용해서 Fine-tuning을 진행해보고자 한다.

Last updated