최종 프로젝트 Version
Version 1
욕설분류를 중심으로 감지모델을 제작해보자
라이브커머스가 요즘 핫하니 이걸 도메인으로 삼아보자!
Version2
라이브커머스를 직접 봐보니 욕설이 없더라... 클린한방송...
욕설에 대한 제재가 어느정도인지 확인해보자! -> 제재가 없음을 확인
욕설 외에 감성분석 등을 통한 요약보고서를 만들어보면 어떨까?
Version3
라이브커머스가 점차 사용자가 늘어나면 욕설분류가 필요할것이다!!
Pororo를 활용해서 대화요약을 시켜봤는데 잘되지 않음...
다양한 사람의 글을 하나로 만드는건 어려움
각 계정별로 요약하는건 무의미함
요약보다 감성분석을 통한 시청자반응을 제공하면 어떨까??
Version4
욕설 분류는 확정!!
시청자 긍부정 반응의 시각화반안에 대해 고민해보자
시청자 FAQ도 따로 보기 쉽게 제공하면 좋을듯
시청자의 반응을 카테고리 별로 제공하면 더 좋을듯 -> keep
예를 들어 의류 제품이면 사이즈, 색상, 재질에 대한 문의가 많을 것이고, 이를 카테고리별로 분류해서 제공하면 시청자들이 주로 궁금해하는 내용을 더 자주 설명할 수 있도록 할수있을것이다.
Version5
apex chart로 부터 Pie차트, Area차트를 제공
워드클라우드를 통해 긍부정문장에 나타나는 단어를 표출
ISSUE
끊어쓰는 채팅에 대한 처리 (ex. 씨 (enter) 발(enter))
앞뒤 문맥에 따른 의미의 변화
긍정, 부정이 섞여있는 채팅 글
Version6
프로젝트 기한을 고려하여 가능한 수준으로 고려할 것.
룰베이스 욕설분류 + 욕설분류모델, 감성분석모델
실제 채팅서비스를 구현하기보다 크롤링한 데이터를 채팅형식으로 올려주는식으로 구현
끊어쓰는 채팅은 DL쪽보다 개발영역에서 처리할 부분으로 일단생략
방안으로는 분석모델 처리시 사용자별 시간을 고려해서 앞문장을 함께 추론한다.
Last updated