카카오, Agentic AI Kanana 모델로 혁신

by DD
7개월 전
조회수 3

카카오의 Kanana 모델이 Agentic AI로 진화하며, 멀티모달 기능을 강화함

Kanana-2Multi-head Latent Attention(MLA)MoE 구조를 통해 추론 효율성을 극대화함

Kanana-o텍스트, 음성, 이미지를 동시에 이해하는 옴니 모델로 발전 중

Kanana-2: 효율적인 추론을 위한 아키텍처

Kanana-2는 Multi-head Latent Attention(MLA)Mixture of Experts(MoE) 구조를 채택하여 긴 입력 시퀀스를 효과적으로 처리한다. 구체적으로, MoE는 모델 파라미터 수를 늘리지 않으면서도 추론 처리량(Throughput)을 향상시킨다. 따라서, 대규모 트래픽 환경에서도 안정적인 성능을 유지하며, 자원 사용량 감소를 가능하게 한다.

멀티모달 모델 Kanana-o의 기술적 특징

Kanana-o는 텍스트, 음성, 이미지를 통합적으로 이해하고 생성하는 옴니 모델이다. Kanana-v는 시각 정보를, Kanana-a는 음성 정보를 처리한다. 따라서, 멀티모달 데이터를 활용하여 사용자에게 더욱 풍부한 AI 경험을 제공하며, 한국어 특화 데이터셋을 통해 정확도를 높였다.

Agentic AI 생태계 구축을 위한 전략

카카오는 Instruction Following, Tool use, Grounding 능력을 강화하여 Agentic AI의 핵심 역량을 확보할 계획이다. 구체적으로, Instruct 모델Reasoning 모델을 통합하여 카카오 서비스에 최적화된 하이브리드 언어모델을 개발한다. 결과적으로, 사용자 맞춤형 AI 서비스를 제공하고, AI 생태계 확장에 기여할 것이다.

Agentic AI를 향한 카나나 모델의 진화