나라지식정보컨소시엄, 문화·게임 콘텐츠 분야 용어 말뭉치 구축

나라지식정보컨소시엄, 문화·게임 콘텐츠 분야 용어 말뭉치 구축

이경우 기자
입력 2022-12-13 11:22
수정 2022-12-13 11:22
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0

품질 검증 후 ‘AI허브’에 공개

각종 커뮤니티에서 사용되는 언어가 정치·경제·문화 등 사회 각 분야에서 활발하게 수용되면서 커뮤니티 언어의 영향력이 커지고 있다. 이에 과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 한국어 자연어 처리 기술 발전과 인력 양성을 위해 ‘인공지능 학습용 데이터 구축 지원 사업’을 진행하고 있다.

이와 관련해 ㈜나라지식정보 컨소시엄(㈜나라지식정보, 루리웹닷컴, 비플라이소프트㈜, ㈜알토비전, ㈜인벤, 전북대 산학협력단)은 과기정통부와 NIA가 진행하는 ‘2022년 인공지능 학습용 데이터 구축 지원 사업’ 중 ‘문화, 게임 콘텐츠 분야 용어 말뭉치’의 데이터 구축 사업을 수행했다고 13일 밝혔다. 이 사업은 ‘게임 용어’와 ‘문화 용어’(미디어 및 레저 용어)를 기계가 빠르게 인식할 수 있도록 하는 데이터 구축 사업이다.

컨소시엄은 ‘문화 및 게임 분야’ 신조어 약 9만개에 대한 정의와 단어 간의 관계를 데이터베이스로 구축했으며, 이 용어들이 포함된 문장 약 60만개에 대한 AI 학습용 데이터 구축 작업도 수행했다고 밝혔다.

구축된 데이터는 품질 검증 후 ‘AI허브’(https://aihub.or.kr)에 공개할 예정이다. 데이터셋과 함께 데이터 구조, 데이터 사용 환경 및 사용 방법 등에 대한 설명도 제공할 예정이다. 데이터셋은 챗봇 연구개발, 인공지능 분야 학술연구를 위한 기초 자료로도 활용된다.

Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
챗GPT의 성(性)적인 대화 허용...여러분의 생각은 어떤가요?
글로벌 AI 서비스 업체들이 성적인 대화, 성애물 등 ‘19금(禁)’ 콘텐츠를 본격 허용하면서 미성년자 접근 제한, 자살·혐오 방지 등 AI 윤리·규제 논란이 한층 가열되고 있다. 챗GPT 개발사인 오픈AI도 ‘GPT-4o’의 새 버전 출시 계획을 알리며 성인 이용자에게 허용되는 콘텐츠 범위를 확대하겠다고 밝혔다. 19금 대화가 가능해지는 챗GPT에 대한 여러분은 생각은 어떤가요?
1. 찬성한다.
2. 반대한다.
광고삭제
광고삭제
위로