고유번호: http://www.riss.kr/link?id=A106258859
제목: 한국어 TTS에 적용되는 /ㄴㄹ/ 연쇄의 발음 처리에 대하여-TTS의 발음에 대한 국어 음운론적 관점의 진단- = A Study on the pronunciation problems of /n-l/ string in Korean TTS System
저자명: 임현열
학술지명: 국어국문학
권호사항: 187
수록면: 103-135
발행년도: 2019
등재정보: KCI
In this study, we investigated the pronunciation problems of /n-l/ string in Korean TTS system, and suggested the points to consider in TTS system for proper pronunciation processing of Korean TTS. To this end, this study examined how Naver Papago and Google Translator handle various /n-l/ strings. As a result, it was found that the accuracy of the lateralization of /n-l/ string was comparably high, but the accuracy of nasalization of /n-l/ string was very low. Also, it is diagnosed that the cause of this phenomenon is that the Korean TTS does not adequately reflect the morphological information related to the lateralization and nasalization of /n-l/ strings. In this study, we propose a method to process the pronunciation of /n-l/ string by reflecting the morpheme information in the process of converting the string to the pronunciation string in order to improve the pronunciation performance of Korean TTS. In addition, there are some cases where it is difficult to produce natural pronunciation in the above-mentioned method. Therefore, it is noted that the corresponding case should be listed separately and the pronunciation information of /n-l/ string should be loaded in the pronunciation information of the corresponding word.
이 연구에서는 한국어 TTS가 산출하고 있는 /ㄴㄹ/ 연쇄와 관련된 발음의 문제점을 살펴보고, /ㄴㄹ/ 연쇄의 적절한 발음 처리를 위해 TTS 시스템에서 고려해야 할 점들을 국어 음운론의 관점에서 제시하였다. 이를 위해 이 연구에서는 네이버 파파고와 구글 번역기의 TTS에서 다양한 /ㄴㄹ/ 연쇄를 어떻게 처리하고 있는지 살폈다. 그 결과, 한국어 TTS에서 /ㄴㄹ/의 유음화는 비교적 정확하게 처리하고 있는 데 반해, /ㄴㄹ/의 비음화와 관련하여 정확성이 낮다는 사실을 알 수 있었다. 또한, 이러한 현상의 원인을 한국어 TTS가 /ㄴㄹ/ 연쇄의 유음화와 비음화에 관여하는 형태소 정보를 적절히 반영하지 못하고 있기 때문이라고 진단하였다. 이에 이 연구에서는 한국어 TTS의 /ㄴㄹ/ 연쇄 발음 성능 향상을 위해 문자열을 발음열로 변환하는 과정에 형태소 정보를 반영하여 /ㄴㄹ/ 연쇄의 발음을 처리하는 방안을 제시하였다. 더불어, 위와 같은 방식으로 자연스러운 발음이 산출되기 어려운 일부 사례가 있기 때문에 해당되는 사례는 별도로 목록화하여 해당 단어의 발음 정보에 /ㄴㄹ/ 연쇄의 발음 처리 정보를 탑재해 두어야 한다는 점도 언급하였다.
|