초록 다중 레이블 특징 선별은 다중 레이블 데이터, 예를 들어 인문 데이터의 분류 정확도를 개선하기 위한 유망한 전처리방법이다. 그중 진화 탐색 기반 다중 개체군 유전 알고리즘은 기존 유전 알고리즘보다 개체군의 다양성을 보존하고 최적 해를 찾을 때까지 조기 수렴을 방지할 수 있으므로 적합한 특징 부분 집합을 찾는 데 유용함이 입증되었다. 그러나 종래의 방법은 해를 찾는 과정에서 다중 레이블과 관련성이 높은 특징을 유입시키는 것에 한계가 있다. 본 논문에서는 다중 레이블 특징 선별을 위한 효과적인 다중 개체군 유전 알고리즘을 제안한다. 제안하는 방법은 이주 개체 정제 연산을 통해 개체군의 다양성을 보존하면서 다중 레이블과 관련성이 높은 특징을 유입시켜 탐색 성능을 향상한다. 실험을 통해 제안하는 방법이 비교 대상 다중 개체군 알고리즘보다 좋은 성능을 보여줌을 확인하였다.
키워드: 인문데이터 분석, 다중 레이블 분류, 특징 선별, 다중 개체군, 진화적 탐색 |