카카오 AI 언어 모델, 인간보다 한국어 독해능력 높아
카카오 AI 언어 모델, 인간보다 한국어 독해능력 높아
  • [오늘경제 박세아 기자]
  • 승인 2019.02.01 09:39
  • 댓글 0
이 기사를 공유합니다

AI 한국어 독해 능력 평가서 1위 차지
자체 개발, 향후 카카오 미니에도 적용
출처: 카카오
출처: 카카오

[오늘경제] 카카오는 자체 개발한 AI 언어 모델이 한국어 학습 데이터 'KorQuAD(The Korean Question Answering Dataset)'를 바탕으로 한 기계 독해 능력 평가에서 91.85점을 받으며 1위를 차지했다고 31일 밝혔다. 

이는 평가 주최인 LG CNS가 인간의 문장 판별 및 독해 능력 수준(Human Performance)이라고 밝힌 91.20점보다 0.65점 높은 수치로, AI가 인간보다 높은 점수를 기록한 것은 처음이다.

LG CNS가 운영하는 기계 독해 능력 평가는 미국 스탠포드 대학에서 시작된 AI 언어지능 연구용 질의응답 학습 데이터셋인 SQuAD(The Stanford Question Answering Dataset)와 동일한 방식으로 구현된다. 

LG CNS는 지난해 12월  한국어 학습을 위한 데이터인 KorQuAD를 구축해 오픈소스로 공개했으며, 누구나 이를 바탕으로 학습한 자체 개발 AI 언어 모델을 제출해 성능을 공식 평가받을 수 있도록 했다.

평가는 데이터셋에서 추출한 내용을 질문으로 제시하고 이에 대해 개발 모델이 답을 찾아내는 방식으로 이루어진다. 

이번에 평가받은 카카오 AI 언어 모델은 구글의 AI 언어 모델 BERT에 카카오의 형태소 분석기 'khaiii’를 접목, 조사의 사용과 어미의 다양한 변형 등 한국어의 고유 특성에 최적화된 것이다. 

카카오는 지난해 말 딥러닝 기술 기반의 형태소 분석기 khaiii를 국내 최초 오픈소스로 제공하는 등 국내 AI 기반 언어지능 연구 발전을 위해서도 노력하고 있다.

김응균 자연어처리파트장은 “이번 평가 결과는 카카오의 인공지능 자연어 처리 기술을 활용해 인간의 독해 능력을 넘어서는 최초의 모델을 구현했다는 점에서 높이 평가받을만하다”며 “금번 개발한 언어 모델 기술을 스마트 스피커 카카오 미니에 적용하기 위한 연구를 진행 중”이라고 전했다.

[오늘경제=박세아 기자] pkl219@startuptoday.co.kr

오늘경제, STARTUPTODAY


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.