한국어 쓰기 텍스트-점수 구간 데이터 세트 (304건)

중앙대학교 인공지능인문학연구소

HK+인공지능인문학


제목	한국어 쓰기 텍스트-점수 구간 데이터 세트 (304건)2021-04-19 13:43
작성자	aihumanities
첨부파일	korean_essay_score_range_prediction_dataset.zip (1.75MB)
첨부의 데이터 세트는 한국언어문화학 18권 1호 (2021.4.30.) 논문에 사용된 실험 데이터 세트입니다. 조희련, 이유미, 임현열, 차준우, 이찬규, "딥러닝 기반 언어모델을 이용한 한국어 학습자 쓰기 평가의 자동 점수 구간 분류 -KoBERT와 KoGPT2를 중심으로-," 한국언어문화학 18권 1호. (2021.4.30.) [doi: http://dx.doi.org/10.15652/ink.2021.18.1.217] 이 데이터 세트는 한국어 쓰기 텍스트와 텍스트가 얼마나 잘 작성되었는지를 평가한 결과를 숫자(3, 2, 1, 0)로 라벨링한 데이터 세트입니다. 총 304개의 데이터가 들어 있습니다. 여기서 (3, 2, 1, 0)의 수치 레이블은 A, B, C, D의 평어에 해당합니다. (A=3, B=2, C=1, D=0) 실험에 사용된 소스코드는 GitHub (https://github.com/heeryoncho/korean_essay_grade_prediction)에서 다운로드 받으실 수 있습니다.
#한국어 쓰기 # 점수 구간 # 지도학습 # 분류 # 데이터셋

이전	24개 한국인 감정 기반 얼굴 표정 인식 데이터 세트	aihumanities	2021-12-15
-	한국어 쓰기 텍스트-점수 구간 데이터 세트 (304건)	aihumanities	2021-04-19