목차 1. 서론 2. 인공지능 학습용 감정 데이터셋 현황 3. 연구 방법 4. 분석 결과 및 논의점 5. 요약 및 결론
초록 인간의 감정을 인공지능 기술로 이해하고 처리하기 위한 연구가 활발하다. 감정의 이해는 언어를 이해하는 것보다 어려운 작업이며, 텍스트의 경우 맥락에 기반하여 감정을 식별하는 것이 중요하다. 이와 관련하여 최신의 언어 모델은 감정 어휘뿐 아니라 주변 어휘와의 관계성을 함께 학습하므로, 감정 데이터셋이 어떤 대상을 다루는지에 따라 학습 양상이 달라질 수 있다.
본 연구는 인공지능 학습용 감정 데이터셋을 대상으로 개체명 인식에 기반한 텍스트마이닝을 수행하고, 어떤 개체 유형과 어휘가 감정 표현에서 나타나는지 분석한다. 공감 대화, 문학 작품, 소셜 미디어 댓글 등 서로 다른 스타일의 텍스트에서 어떤 개체 유형이 나타나는지 살펴보고, 이를 통해 감정 데이터셋의 활용 및 구축 분야에서 고려할 점에 대해 생각해본다. 이 연구는 감성 컴퓨팅 관점에서 인공지능 학습용 데이터의 분석 자료를 제공한다. 또한 연구에서 사용한 개체명 인식 분석 방법이 텍스트마이닝 연구자에게 방법론적인 도움을 줄 수 있을 것으로 기대한다. |