첨부의 데이터 세트는 한국언어문화학 18권 1호 (2021.4.30.) 논문에 사용된 실험 데이터 세트입니다. 조희련, 이유미, 임현열, 차준우, 이찬규, "딥러닝 기반 언어모델을 이용한 한국어 학습자 쓰기 평가의 자동 점수 구간 분류 -KoBERT와 KoGPT2를 중심으로-," 한국언어문화학 18권 1호. (2021.4.30.) [doi: http://dx.doi.org/10.15652/ink.2021.18.1.217] 이 데이터 세트는 한국어 쓰기 텍스트와 텍스트가 얼마나 잘 작성되었는지를 평가한 결과를 숫자(3, 2, 1, 0)로 라벨링한 데이터 세트입니다. 총 304개의 데이터가 들어 있습니다. 여기서 (3, 2, 1, 0)의 수치 레이블은 A, B, C, D의 평어에 해당합니다. (A=3, B=2, C=1, D=0) 실험에 사용된 소스코드는 GitHub (https://github.com/heeryoncho/korean_essay_grade_prediction)에서 다운로드 받으실 수 있습니다.
|