카카오, AI로 법인카드 정산 자동화! OCR과 LLM의 만남
by DD
9개월 전
조회수 4
OCR 기술과 LLM을 활용하여 법인카드 영수증의 지출 항목 자동 분류를 구현함
카카오 자체 LLM 모델인 카나나를 통해 한국어 인식 정확도를 98% 이상으로 향상시킴
AI 간편 정산 기능을 통해 직원들의 반복적인 정산 업무 시간 절감을 목표로 함
OCR 기술의 한계와 LLM의 역할
기존 OCR 기술은 영수증과 같은 비정형 문서에서 정확한 정보 추출에 어려움을 겪었다. LLM은 텍스트 추출을 넘어 문맥을 이해하고, 오류 보정 및 구조적 데이터 추출을 수행한다. 따라서 AI 간편 정산의 핵심 기능을 가능하게 했다.
카카오 '카나나' 모델의 성능
카카오의 카나나 모델은 한국어 영수증 인식에 특화되어 98% 이상의 정확도를 달성했다. 해상도나 명암비가 낮은 이미지에서도 높은 인식률을 유지하며, 영수증 인식률 향상에 기여했다. 결과적으로 프로젝트 성공의 핵심 요소가 되었다.
프롬프트 엔지니어링의 중요성
같은 LLM 모델이라도 프롬프트의 '위치, 어투, 표현'에 따라 결과물의 품질이 크게 달라진다. 프롬프트 엔지니어링을 통해 정확도 향상을 이끌어낼 수 있으며, 이는 AI 시스템 성능 최적화에 필수적이다. 따라서 프롬프트 설계는 매우 중요하다.