최종 프로젝트 Version

Version 1

  • 욕설분류를 중심으로 감지모델을 제작해보자

  • 라이브커머스가 요즘 핫하니 이걸 도메인으로 삼아보자!

Version2

  • 라이브커머스를 직접 봐보니 욕설이 없더라... 클린한방송...

  • 욕설에 대한 제재가 어느정도인지 확인해보자! -> 제재가 없음을 확인

  • 욕설 외에 감성분석 등을 통한 요약보고서를 만들어보면 어떨까?

Version3

  • 라이브커머스가 점차 사용자가 늘어나면 욕설분류가 필요할것이다!!

  • Pororo를 활용해서 대화요약을 시켜봤는데 잘되지 않음...

    • 다양한 사람의 글을 하나로 만드는건 어려움

    • 각 계정별로 요약하는건 무의미함

  • 요약보다 감성분석을 통한 시청자반응을 제공하면 어떨까??

Version4

  • 욕설 분류는 확정!!

  • 시청자 긍부정 반응의 시각화반안에 대해 고민해보자

  • 시청자 FAQ도 따로 보기 쉽게 제공하면 좋을듯

  • 시청자의 반응을 카테고리 별로 제공하면 더 좋을듯 -> keep

    • 예를 들어 의류 제품이면 사이즈, 색상, 재질에 대한 문의가 많을 것이고, 이를 카테고리별로 분류해서 제공하면 시청자들이 주로 궁금해하는 내용을 더 자주 설명할 수 있도록 할수있을것이다.

Version5

  • apex chart로 부터 Pie차트, Area차트를 제공

  • 워드클라우드를 통해 긍부정문장에 나타나는 단어를 표출

  • ISSUE

    • 끊어쓰는 채팅에 대한 처리 (ex. 씨 (enter) 발(enter))

    • 앞뒤 문맥에 따른 의미의 변화

    • 긍정, 부정이 섞여있는 채팅 글

Version6

  • 프로젝트 기한을 고려하여 가능한 수준으로 고려할 것.

  • 룰베이스 욕설분류 + 욕설분류모델, 감성분석모델

  • 실제 채팅서비스를 구현하기보다 크롤링한 데이터를 채팅형식으로 올려주는식으로 구현

  • 끊어쓰는 채팅은 DL쪽보다 개발영역에서 처리할 부분으로 일단생략

    • 방안으로는 분석모델 처리시 사용자별 시간을 고려해서 앞문장을 함께 추론한다.

Last updated