중앙대학교 인문콘텐츠연구소

HK+인공지능인문학

학술활동연구논문

연구논문

학술활동연구논문

연구논문

제목자연스러운 TTS 구현을 위한 ㄴ 첨가 처리 방안2019-01-14 11:33
작성자 Level 10

고유번호: http://www.riss.kr/link?id=A105280566

제목: 자연스러운 TTS 구현을 위한 ㄴ 첨가 처리 방안 = A study on the processing of n-insertion in natural TTS implementation - Focusing on a model presentation that harmonizes standard and real pronunciation

저자명: 임현열(Im, Hyeonyeol)  

학술지명: 語文論集

권호사항: Vol.73 No.- [2018]

수록면: 31-59(29쪽)

발행처: 중앙어문학회

발행년도: 2018.03

등재정보: KCI등재

기타사항:


초록:

이 연구에서는 먼저 ㄴ 첨가 발음이 수의적 음운현상이라는 점을 확인하고, 과거에 수행된 발음 실태 조사 결과를 살펴 ㄴ 첨가 발음의 실현 양상을 점검하였다. 또한, 구글 번역기와 네이버 파파고에서 제공하고 있는 TTS 발화에서 ㄴ 첨가 관련 단어들을 어떻게 발음하고 있는지 살펴보고, TTS 발화의 ㄴ 첨가발음이 비체계적으로 실현되고 있을 뿐만 아니라, 표준 발음에 얽매여 현실 발음을 적절히 반영하지 못하고 있다는 점을 지적하였다.

이를 바탕으로 이 연구에서는 자연스러운 TTS 구현을 위한 ㄴ 첨가 처리 방안을 제시하였다. 주요 내용은 현실 발음 사전을 구축하여 TTS 알고리즘에 반영하고, 사용자의 선호에 따라 현실 발음을 적용하는 비율을 조정하게 하는 방안이다. 즉, 자연스러운 TTS 발음 구현을 위해 ㄴ 첨가 환경에 놓인 단어들에 대해 기본적으로 표준 발음대로 발음을 산출하게 하되, 현실 발음을 고려하여 경우에 따라 ㄴ 첨가의 적용 여부를 달리하는 방식이다. 다만, 사용자에 따라 ㄴ 첨가 발음과 관련하여 표준 발음을 선호하거나 현실 발음을 선호하는 정도가 다르기 때문에 사용자가 ㄴ 첨가 발음 선호도를 조정하여 TTS를 사용할 수 있게 하는 방안을 제시하였다.


In this study, we first confirm that n-insertion pronunciation is an optional phonological phenomenon; thereafter, we assess the realization pattern of n-insertion pronunciations by examining the results of past pronunciation studies. In addition, we examine how n-insertion words are pronounced in text-to-speech (TTS) utterances provided by Google Translator and Naver Papago, revealing that the n-insertion pronunciations of TTS utterances are unrealistically realized and that the pronunciation is not properly reflected.

Based on this, we propose an n-insertion method for natural TTS implementation. The main content is to construct a real pronunciation dictionary, reflect it in the TTS algorithm, and adjust the rate of applying real pronunciation according to user preference. In other word, to implement a natural TTS pronunciation, the pronunciation of the words placed in the n-insertion environment is basically calculated according to the standard pronunciation. However, since the degree of preference of the standard pronunciation or the degree of preference of the real pronunciation is different in relation to the n-insertion pronunciation according to the user, we suggest a method that allows the user to use the TTS by adjusting the n-insertion pronunciation preference.


키워드:

ㄴ 첨가  ,수의적 음운현상  ,표준 발음  ,현실 발음  ,발음 선호도  ,음성 합성  ,음성산출  ,TTS(Text-to-speech)  ,n-insertion ,optional phonological phenomenon  ,standard pronunciation  ,realistic pronunciation  ,pronunciation preference  ,speech synthesis ,speech production

중앙대학교 인문콘텐츠연구소
06974 서울특별시 동작구 흑석로 84 중앙대학교 310관 828호  TEL 02-881-7354  FAX 02-813-7353  E-mail : aihumanities@cau.ac.krCOPYRIGHT(C) 2017-2023 CAU HUMANITIES RESEARCH INSTITUTE ALL RIGHTS RESERVED