한국정보화진흥원, 인공지능 학습용 한국어 데이터 250만개 공개
한국정보화진흥원, 인공지능 학습용 한국어 데이터 250만개 공개
  • 문소영 기자
  • 승인 2019.06.14 10:57
  • 댓글 0
이 기사를 공유합니다

인공지능(AI) 오픈 이노베이션 허브 포털(aihub.or.kr) 화면 사진=한국정보화진흥원
인공지능(AI) 오픈 이노베이션 허브 포털(aihub.or.kr) 화면 사진=한국정보화진흥원

[퓨처타임즈=문소영기자] 인공지능이 한국인의 감정과 한국어의 자연스러운 발성을 배울 수 있는 학습용 데이터가 대중에 공개된다.

한국정보화진흥원(NIA)은 인공지능 학습용 데이터 250만개를 공개했다고 14일 밝혔다.

이번에 공개된 데이터는 감정·상황·대회 내용을 담고 있는 복합 영상, 자연스러운 한국어 대화 음성, 한국어 챗봇용 대화 및 시나리오, 한국어 기계독해 데이터 등이다. 이 데이터는 NIA가 운영하는 'AI허브' 누리집에서 간단한 회원가입만 하면 누구나 사용할 수 있다.

데이터의 확보가 AI의 경쟁력이지만 대다수의 중소벤처스타트업은 많은 비용과 시간이 소요되는 데이터 구축에 어려움을 겪고 있다. 따라서 NIA의 인공지능 데이터 구축·공개 사업은 AI 시장에 진입하고자 하는 중소·벤처·스타트업에게 도움이 될 것이다. 2017년 법률, 특허, 일반상식, 한국형 이미지 등 4종의 데이터셋 구축을 시작으로 올해 1월 관광, 농업, 헬스케어 등 7종을 개방,6월에 한국어 음성 등 4종을 추가 개방했다. 올 연말에는 한·영 번역말뭉치, 한국형 사물이미지, 한글 글자체 이미지, 이상행동 영상 등 102500여만건의 데이터셋을 대량으로 공개할 예정이다. 또한 국가 R&D 과제인 '지능정보 플래그십 사업'(음성언어영상 등 다양한 정보를 복합적으로 학습하여 사람과 상호작용하는 대화형 에이전트 기술 및 서비스를 개발하는 AI분야 연구개발 사업) 등을 통해 개발된 인공지능 학습용 데이터도 오는 7AI허브에 공개할 예정이다.

문용식 NIA 원장은 "인공지능 제품과 서비스가 활발히 개발되고 출시될 수 있도록 수요에 꼭 맞는 데이터셋을 대량 구축·공개할 것"이라며 "국내 인공지능 산업 경쟁력을 강화하는 데 역량을 집중하겠다"고 말했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • 서울특별시 영등포구 국회대로 800 (여의도동, 여의도파라곤) 1236호
  • 대표전화 : 02-783-7789
  • 팩스 : 02-783-7790
  • 청소년보호책임자 : 최성립
  • 법인명 : 퓨처타임즈
  • 제호 : 퓨처타임즈
  • 등록번호 : 서울 아 51999
  • 등록일 : 2017-11-20
  • 발행일 : 2017-05-01
  • 발행인 : 송승호
  • 편집인 : 송승호
  • 퓨처타임즈 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2019 퓨처타임즈. All rights reserved. mail to
ND소프트