중앙대학교 인문콘텐츠연구소

HK+인공지능인문학

아카이브칼럼

칼럼

글보기
Chung-Ang Auditory Database of Korean Emotional Speech: A Validated Set of Vocal Expressions with Different Intensities
Level 10조회수15
2024-12-16 13:00


 

중앙대학교 인문콘텐츠연구소가 개발한 음성 데이터베이스의 개발과정과 타당성을 검증한 논문이다. 다양한 감정을 두 가지 강도로 녹음한 이 음성 데이터베이스는 ‘중앙 한국어 음성 감정 데이터베이스(CADKES)’로 명명되었으며 연구소 홈페이지에 공개되었다. CADKES는 18명의 연기자가 25개의 문장을 각각 6개 감정(중립, 행복, 슬픔, 분노, 두려움, 지루함)으로 녹음하여 총 5,400개 문장으로 구성되어 있다. 검증 실험은 감정 유형 식별 및 자연스러움 판단을 포함한다. 검증 실험 데이터는 일련의 통계분석을 통해 감정 식별 정확도, 평가자 간 및 평자가 내 신뢰도, 감정 식별 정확도와 자연스러움 간 관계, 그리고 강도, 청자의 성별, 화자의 성별, 감정 유형의 감정 지각에의 영향을 분석하였다. CADKES 관련 논문은 IEEE Access에 게재되었고, 저자들에게 이메일로 요청하는 것으로 데이터를 건네받을 수 있다.

음성 감정 지각에서 강도의 역할은 점점 주목을 받고 있음에도 감정의 강도를 달리하여 구축된 음성 감정 데이터베이스는 소수에 불과하다. 특히 한국어의 경우 감정 강도를 반영한 음성 감정 데이터베이스는 구축된 바 없다. 이에 본 연구는 한국어 음성 감정 표현 데이터베이스를 구축 및 검증하였다. 음성 표현은 18명의 연기자를 대상으로 센 강도와 보통 강도로 6개 감정(중립, 행복, 슬픔, 분노, 두려움, 지루함)을 25문장을 사용해 녹음하였다. 그 결과 데이터베이스는 센 강도로 발화한 2700문장과 보통 강도로 발화한 2700문장으로 구성되었다. 음성 감정 발화의 타당성 검증을 위해 25명의 한국어 청자를 대상으로 감정 유형 식별과 감정의 자연스러움 정도를 평가하는 지각 실험을 진행하였다. 청자는 모두 각각 5400개의 문장을 평가하여 135000개의 응답을 확보하였다. 지각 실험 결과, 센 강도는 감정 인식률은 81%.21%―93.19%에 달했고, 보통 강도는 감정 인식률이 68%.77%―89.51%로 나타났다. 나아가 감정 유형별로도 센 강도의 감정 인식률은 보통 강도에 비해 높았다. 또한 감정 유형을 인식하고 감정 유형별 자연스러움을 평가하는데 있어서 높은 평가자 간 신뢰도와 평가자 내 신뢰도를 보였다. 또한 감정 유형 인식률과 감정 표현의 자연스러움 간 높은 상관관계를 보여, 해당 감정 유형의 감정 표현이 자연스러울수록 자연스럽게 인식된 것으로 나타났다. 

NAM, Youngja; LEE, Chankyu. Chung-Ang Auditory Database of Korean Emotional Speech: A Validated Set of Vocal Expressions With Different Intensities. IEEE Access, 2022, 10: 122745-122761. 

중앙대학교 인문콘텐츠연구소는 2024년 10월 30일로 종료된 인공지능인문학 구축 사업의 주요 연구 성과를 공유하고자 합니다. 매주 대표 저술과 논문을 선별하여 뉴스레터의 형식으로 그 내용을 간략히 소개합니다. 

중앙대학교 인문콘텐츠연구소
06974 서울특별시 동작구 흑석로 84 중앙대학교 310관 828호  TEL 02-881-7354  FAX 02-813-7353  E-mail : aihumanities@cau.ac.krCOPYRIGHT(C) 2017-2023 CAU HUMANITIES RESEARCH INSTITUTE ALL RIGHTS RESERVED