텍스트 마이닝 기법을 활용한 시조 분석 ― 코로나-19 창작 시조를 중심으로Analysis of Sijo Using Text Mining Techniques
이른바 4차 산업혁명 시대라 부르는 새로운 세상으로의 변화를 재촉하는 바람이 거세다. 이러한 변화는 학문 분야도 예외가 아니다. 자연과학과 인문학 사이의 경계선이 조금씩 희미해지고 있으며, 이는 두 학문 간의 융합 연구를 통해서 현실화되고 있다. 자연과학의 디지털 기법을 활용하여 인문학의 텍스트를 분석하는 연구도 조금씩 다양한 방식으로 시도되고 있다. 이러한 상황에서 본고는 텍스트 마이닝 기법을 활용한 시조 분석의 가능성과 효용성을 확인하는 작업의 일환이다.
주지하듯이 시조(時調)는 시절가조(時節歌調)를 줄여서 부르는 말이다. 당시의 시대상을 잘 반영하는 일종의 유행가인 시조는 최근 몇 년 동안 온 세상을 관통하고 있는 이슈, 바로 코로나-19 팬데믹 상황에서도 시대를 비추는 거울로서의 임무를 충실히 수행하고 있다. 이는 최근 창작되고 있는 현대시조를 통해서도 확인할 수 있다. 시절을 반영하는 시조의 특성은 학생들이 창작한 시조에서도 드러날 것으로 기대하고, 본고에서는 2021년과 2022년 국어국문학과 전공수업을 수강한 192명의 학생들이 ‘코로나-19’를 제재로 하여 창작한 195편의 창작 시조를 분석의 대상으로 삼았다. 그리하여 코로나-19에 대한 학생들의 인식 양상에 대해 살펴보았다.
전체 3가지 방식의 텍스트 마이닝 기법을 적용하여 학생들이 창작한 시조를 분석해 보았는데, 처음으로는 KoNLP를 활용하여 형태소를 분석하여 작품의 단어 출현 빈도를 분석하고 Word2Vec의 기능을 활용하여 이를 임베딩 하였다. 그 결과 2021년과 2022년에 창작된 각각의 시조 작품들에서 공통적으로 빈출하는 단어가 ‘코로나’, ‘마스크’ 외에도 ‘사람’, ‘우리’, ‘얼굴’, ‘언제’ 등이라는 사실을 확인하고 이를 코로나-19 팬데믹이 일상에 끼친 변화와 위기, 그리고 이를 극복하고자 하는 의지의 표출과 관련이 있는 것으로 파악하였다. 다음으로 KNU 한국어 감성사전을 통해서 감정어 분석을 진행해 보았다. 그 결과 2021년에 비해 2022년에 창작한 작품에서 강한 감정 표현을 담고 있는 단어의 사용이 줄어드는 경향이 있음을 확인할 수 있었는데, 이는 코로나-19가 장기화하자 사람들이 이 상황에 익숙해지면서 감정의 표출 정도가 조금씩 약화된 결과로 보았다. 그 밖에도 2021년과 2022년에 두드러진 감정어들을 비교해 보았는데, 이를 통해서 시간의 경과에 따라 코로나-19에 대한 학생들의 인식 또한 변화하고 있음을 확인할 수 있었다. 마지막으로 시조 제목을 워드 클라우드로 시각화하고 그 결과를 분석하였다. 이를 통해서 2021년에 비해 2022년에는 상대적으로 긍정적인 단어가 제목으로 출현하는 경향이 높다는 점을 알 수 있었는데, 이는 앞선 감정어 분석과 유사한 결론이라 나름의 의미를 부여할 수 있지 않을까 한다. |