옛 한글 식별할 수 있는 AI 학습용 데이터 구축 나선다

  • 손병현
  • |
  • 입력 2021-06-27 17:00  |  수정 2021-06-28 08:45  |  발행일 2021-06-27
경북도, 안동대·포스텍·한국국학진흥원·<주>인플랫과 컨소시엄

한글 콘텐츠 기반의 새로운 문화사업 계기 마련
(2-1)옛한글_데이터_구축과정
옛 한글 데이터 구축 과정. <경북도 제공>

경북도가 획과 크기, 형태가 다른 옛 한글을 식별할 수 있는 인공지능(AI) 학습용 데이터 구축에 나선다.


최근 과학기술정보통신부와 한국지능정보사회진흥원의 '2021년 인공지능 학습용 데이터 구축 지원사업'에 경북도가 제출한 '옛 한글 문자인식(OCR) 데이터셋 구축사업'이 신규 대상 사업으로 선정됐다.


이에 도는 국비 19억원을 포함해 총 21억원을 들여 도내 1천만개 이상의 옛 한글 자료를 학습 시켜 획, 크기, 형태가 모두 다른 옛 한글을 식별해낼 수 있는 AI 학습용 데이터를 구축한다.


이를 위해 경북도와 안동대를 거점으로 포스텍, 한국국학진흥원, ㈜인플랫 등 5개 기관이 컨소시엄을 구성했다.


사업 진행 전반을 경북도가 관리하면서 안동대는 총괄 품질관리 및 검수와 다양한 옛 한글 이미지 분석한다.


포스텍은 원천데이터 의미 태깅 도구 개발과 딥러닝 기반 기술 개발, 국학진흥원은 옛 한글 자료 수집과 제공, ㈜인플랫은 옛 한글 이미지와 텍스트 구축 및 원시 데이터 정제 도구 개발에 나서게 된다.


경북도는 이 사업을 통해 지속해서 발굴되고 있는 전국 최대 한글 고서적 자료를 체계적으로 재정리하는 계기를 마련한다는 방침이다. 아울러 한글 고서적 자료를 체계적으로 정리해 옛 한글의 문화가치 연구와 활용 서비스를 전국으로 빠르게 확산시키는 구심적 역할을 할 것으로 기대하고 있다.


김상철 경북도 문화관광체육국장은 "이번에 선정된 한글 AI 사업은 지난 4월 열린 한글 문화·콘텐츠 산업 육성 전문가 토론회에서 제시된 디지털 뉴딜 사업을 구체화한 하나의 사례"라며 "앞으로도 미래 4차 산업 선도와 일자리 창출을 위한 한글 산업 육성에 최선을 다하겠다"고 말했다.


손병현기자 why@yeongnam.com

기자 이미지

손병현

기사 전체보기

영남일보(www.yeongnam.com), 무단전재 및 수집, 재배포금지

사회인기뉴스

영남일보TV

많이 본 뉴스

  • 최신
  • 주간
  • 월간

영남일보TV

더보기