본문으로 바로가기

보도 자료 상세보기

국립국어원, 한국어-외국어 병렬 말뭉치 등 인공지능 언어자원 12종 새로 공개

작성자 국립국어원 등록일 2025. 9. 29. 조회수 1303

국립국어원, 한국어-외국어 병렬 말뭉치 등 인공지능

언어자원 12종 새로 공개

- 한국수어·국어 역사 자료 말뭉치 함께 공개, 인공지능의 한국어 소통 확장에 기여



  국립국어원은 9월 29일(월)에 신규 말뭉치 12종을 국립국어원 ‘모두의 말뭉치’(kli.korean.go.kr/corpus)에서 공개하였다.

 

  국립국어원은 한국어 특화 인공지능 개발과 연구에 필요한 고품질 말뭉치 등 언어자원을 구축하여 산업계와 학계에서 활용할 수 있도록 공개하고 있으며, 이번에 새로 공개한 12종을 포함하여 지금까지 134종의 한국어 말뭉치를 공개하였다.

 

  이번에 공개된 말뭉치는 다국어 언어 처리 및 인공지능 기반의 외국어 통·번역 모델의 품질 향상에 필수적인 한국어-외국어 병렬 말뭉치 8종, 한국수어 사용자의 소통 편의 증진을 위한 수어통역 기술 개발에 활용할 수 있는 한국수어 말뭉치 3종, 국어 역사 자료 말뭉치 1종이다. 이 말뭉치들은 인공지능 시대에 한국어를 매개로 하는 소통 확장 및 한국언어문화 전승에 기여할 수 있는 언어자원으로서 의의가 있다.

 

  지금까지 공개된 134종의 말뭉치는 국어 연구와 언어 정보 처리 분야 연구 및 기술 개발에 활용하고자 하는 연구자, 개발자 등 누구나 이용할 수 있으며, ‘모두의 말뭉치’ 누리집(kli.korean.go.kr/corpus)에서 온라인 약정서를 작성하여 승인을 받으면 내려받을 수 있다.

 

  국립국어원 관계자는 “한국어를 잘하고 한국문화를 잘 아는 독자 인공지능 개발을 뒷받침할 수 있도록 2030년까지 한국어·한국언어문화 말뭉치 누적 340종을 지속적으로 공개할 계획”이라고 밝혔다.

 

 

[붙임] 공개 대상 말뭉치 설명 및 이용 절차 각 1부

담당 부서

국립국어원

책임자

과장

이현주

(02-2669-9750)

 

언어정보과

담당자

학예연구관

박미영

(02-2669-9754)

공공저작물 자유이용허락 표시 기준(공공누리, KOGL) 제1 유형 조건에 따라 저작물의 출처를 구체적으로 표시한 후 이용할 수 있습니다.