• 홈
  • 화살표
  • 국어 알리기
  • 화살표
  • 이음이가 전하는 국어 소식
책 그림
  •  
    이음이가 전하는 국어 소식
  • ‘한국어-외국어 병렬 말뭉치 구축의 쟁점과 활용 방안’ 워크숍 개최

  •  
  •  

 국립국어원(원장 장소원)은 1월 14일(토) 오전 9시 코지 모임 공간 강남역 2호점에서 ‘한국어-외국어 병렬 말뭉치 구축의 쟁점과 활용 방안’을 주제로 워크숍을 개최하였다. 22년 한국어-외국어 병렬 말뭉치 구축 사업단(연구책임자 이정희)이 주최하는 이번 워크숍에서는 국립국어원이 구축하고 있는 한국어-외국어 병렬 말뭉치의 활용 방안 및 기대 효과에 대한 전문가의 특별 강연과 구축 과정에서 발생하는 주요 쟁점에 대한 토론이 진행되었다.

 최근 한국 문화 콘텐츠의 글로벌 확산에 따라 한국과 한국 문화에 대한 관심이 높아지면서 한국어 교육 및 자동 통·번역 기술 개발을 위한 언어 자원 수요가 증가하고 있다. 하지만 영어, 일본어, 중국어 등을 제외한 태국어, 베트남어 등 외국어의 경우 확보된 언어 자원이 매우 부족한 실정이다.

 이러한 상황을 극복하기 위해 국립국어원은 2021년 8월부터 한국과 정치‧경제‧문화 교류가 활발하지만 기구축 언어 자원이 부족한 8개 언어*를 대상으로 한국어-외국어 병렬 말뭉치 구축 사업을 추진해 왔다. 한국어를 8개 언어로 번역한 병렬 말뭉치는 언어 자원의 불균형을 해소하고 관련 산업의 부가 가치를 높이는 데 이용된다.

 * 태국어, 베트남어, 인도네시아어, 캄보디아 크메르어, 필리핀 타갈로그어, 인도 힌디어, 러시아어, 우즈베크어

 국립국어원은 2021년 1차 사업에서 약 800만 어절의 병렬 말뭉치를 성공적으로 구축 완료하였으며, 2022년 이후 1,000만 어절 규모로 확대하여 지속적으로 병렬 말뭉치를 구축하고 있다. 1차 사업에서 구축한 한국어-외국어 병렬 말뭉치는 연구 및 기술 개발의 기초 자료로 누구나 활용할 수 있도록 ‘모두의 말뭉치(https://corpus.korean.go.kr)’를 통해 올해 상반기에 공개될 예정이다.

 이번 워크숍에서는 각계 전문가들을 초청하여 한국어-외국어 병렬 말뭉치가 향후 관련 기술 연구와 산업에 미칠 영향을 전망하고, 병렬 말뭉치 번역 과정에서 발생하는 다양한 쟁점에 대해 작업자들이 서로의 경험과 생각을 나눔으로써 발전적 병렬 말뭉치 자원 구축과 활용 방향을 점검하였다.