서울신문의 창간 배경은 무엇인가요?

서울신문은 1904년 7월 18일에 창간된 구한말의 대표적 민족지 대한매일신보가 기원으로, 한국에서 현재 발행되고 있는 신문 중에서는 가장 오랜 역사를 자랑합니다.

서울신문 신춘문예 당선자에는 누가 있나요?

서울신문은 소설가 - 한강·편혜영·임철우·하성란, 시인 - 나태주·이근배·박세미, 문학평론가 하응백·유성호 등 걸출한 인물들을 배출했습니다.

서울신문 구독 신청은 어디에서 할 수 있나요?

https://company.seoul.co.kr/readers/readers.php에서 온라인 신청이 가능하며, 전화문의(080-233-4967)도 가능합니다.

서울신문의 주요 행사는 어떤 것이 있나요?

매년 진행하는 대표적인 행사로는 ‘봄날음악회’, ‘서울신문 하프마라톤’, ‘마약퇴치기원걷기대회’ 등이 있습니다.

서울신문의 위치는 어디인가요?

본사는 ‘서울특별시 서초구 양재대로 2길 22-16’에 위치하고, 광화문 사옥은 ‘서울특별시 중구 세종대로 124’에 위치합니다.

“한국어 사투리도 알아듣네”… 카카오 ‘카나나 - o’ 공개

신융아 기자

입력 2025-05-02 00:33

수정 2025-05-02 00:33

글씨 크기 조절
글자크기 설정

닫기

글자크기 설정 시 다른 기사의 본문도 동일하게 적용 됩니다.
- 가
- 가
- 가
- 가
- 가
프린트
공유하기
공유

닫기
- 페이스북
- 네이버블로그
- 엑스
- 카카오톡
- 밴드
https://www.seoul.co.kr/news/economy/IT/2025/05/02/20250502012008
URL 복사
댓글
0

한국어 특화… AI 통합 멀티모달
텍스트·음성·이미지 동시에 처리
감정 인식 능력 GPT-4o보다 탁월

카카오가 텍스트 중심의 인공지능(AI) 모델을 넘어 사람처럼 보고 듣고 말하며 공감하는 멀티모달 언어모델을 국내 최초로 공개했다.

카카오는 1일 공식 테크블로그를 통해 통합 멀티모달 언어모델인 ‘카나나-o’와 오디오 언어모델인 ‘카나나-a’의 성능과 개발 후기를 공개했다.

카나나-o는 텍스트와 음성, 이미지 등 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 AI 모델로 이용자가 텍스트·음성·이미지 중 어떤 조합으로 질문해도 상황에 맞게 추론하고 답변할 수 있다. 예를 들어 횡단보도와 신호등이 있는 사진을 보여 주며 “이미지에서 보행자 신호등은 무슨 색이야? 건너도 될까?”라고 질문하면 카나나-o가 이미지를 통해 상황을 인식해 답변하는 식이다.

카나나-o는 이용자의 억양과 말투, 목소리 떨림 등 비언어적 신호를 분석하고, 대화 맥락에 맞는 감정적이고 자연스러운 음성의 응답을 생성하는 것이 특징이다. 특히 한국어 데이터를 대규모로 학습해 한국어에 특화돼 있다. 한국어의 특수한 발화 구조나 억양, 어미 변화 등을 정밀하게 반영하고 제주도나 경상도 등 지역 방언까지도 인식한다고 카카오는 소개했다.

카카오는 카나나-o가 한국어 및 영어 성능평가에서 오픈AI의 ‘GPT-4o’, 구글의 ‘제미나이 1.5 프로’와 같은 글로벌 최고 모델들과 유사한 수준을 기록했다고 밝혔다. 특히 감정 인식 능력에서는 한국어와 영어 모두 다른 모델들보다 높은 점수를 기록했다.

카카오는 향후 카나나-o의 부적절한 응답을 방지하기 위한 안전성을 확보하고, 대화와 데이터의 실시간 대응 능력을 강화해 실제 대화에 가깝도록 연구를 지속할 계획이다.

신융아 기자

2025-05-02 12면