중앙대학교 인문콘텐츠연구소

HK+인공지능인문학

아카이브데이터

데이터

제목한국어 쓰기 텍스트-점수 구간 데이터 세트 (304건)2021-04-19 13:43
작성자 Level 10
첨부파일korean_essay_score_range_prediction_dataset.zip (1.75MB)

첨부의 데이터 세트는 한국언어문화학 18권 1호 (2021.4.30.) 논문에 사용된 실험 데이터 세트입니다.

조희련, 이유미, 임현열, 차준우, 이찬규, "딥러닝 기반 언어모델을 이용한 한국어 학습자 쓰기 평가의 자동 점수 구간 분류 
-KoBERT와 KoGPT2를 중심으로-," 
한국언어문화학 18권 1호. (2021.4.30.) [doi: http://dx.doi.org/10.15652/ink.2021.18.1.217]  

이 데이터 세트는 한국어 쓰기 텍스트와 텍스트가 얼마나 잘 작성되었는지를 평가한 결과를 숫자(3, 2, 1, 0)로 라벨링한 데이터 세트입니다. 총 304개의 데이터가 들어 있습니다. 여기서 (3, 2, 1, 0)의 수치 레이블은 A, B, C, D의 평어에 해당합니다. (A=3, B=2, C=1, D=0)

실험에 사용된 소스코드는 GitHub (https://github.com/heeryoncho/korean_essay_grade_prediction)에서 다운로드 받으실 수 있습니다.


#한국어 쓰기# 점수 구간# 지도학습# 분류# 데이터셋
중앙대학교 인문콘텐츠연구소
06974 서울특별시 동작구 흑석로 84 중앙대학교 310관 828호  TEL 02-881-7354  FAX 02-813-7353  E-mail : aihumanities@cau.ac.krCOPYRIGHT(C) 2017-2023 CAU HUMANITIES RESEARCH INSTITUTE ALL RIGHTS RESERVED