26M 파라미터 모델, Gemini 툴 호출 기능을 구현하다!

by DD
3주 전
조회수 8

Cactus에서 개발한 26M 파라미터의 소형 모델 Needle은 Gemini의 툴 호출 기능을 구현하여 주목받음

FFN(Feed Forward Network)을 제거하고 어텐션(Attention) 메커니즘만 사용하여 모델 경량화에 성공

소형 모델임에도 불구하고 FunctionGemma-270M 등 경쟁 모델 대비 우수한 성능을 보임

홈 어시스턴트(Home Assistant) 및 모바일 환경에서의 활용 가능성에 대한 커뮤니티의 기대가 높음

FFN(Feed Forward Network) 제거를 통한 모델 경량화

Needle은 기존 트랜스포머(Transformer) 모델과 달리 FFN(Feed Forward Network)을 제거하고 어텐션(Attention) 레이어만으로 구성하여 모델 크기를 획기적으로 줄였다. 댓글에 따르면, 이는 외부 지식(External Knowledge)에 의존하는 작업에서 FFN의 필요성이 줄어든다는 연구 결과와 일치한다. 데이터 미저장 정책(Zero-Retention Policy)을 통해 모델의 효율성을 높이고, 소형 디바이스(Small Device)에서도 툴 호출 기능을 원활하게 실행할 수 있도록 설계되었다.

단일 샷(Single-Shot) 툴 호출 성능

Needle은 단일 샷(Single-Shot) 툴 호출 작업에 특화되어 설계되었으며, FunctionGemma-270M, Qwen-0.6B 등 경쟁 모델보다 우수한 성능을 보였다. 이는 단일 샷 툴 호출(Single-Shot Tool Calling)에 최적화된 아키텍처와 훈련 데이터셋(Training Dataset) 덕분이다. 하지만, 대화형 환경(Conversational Setting)에서는 더 큰 모델이 유리할 수 있다는 점에 유의해야 한다. 데이터 격리 아키텍처(Data Isolation Architecture)를 통해 툴 호출의 정확성을 높였다.

홈 어시스턴트(Home Assistant) 및 모바일 환경에서의 활용

커뮤니티에서는 Needle을 홈 어시스턴트(Home Assistant)와 같은 환경에서 활용할 수 있다는 기대감을 나타냈다. 특히, 음성 명령을 자연어 처리(Natural Language Processing)하여 툴 호출을 수행하는 데 유용할 것으로 예상된다. 멀티모달 분석(Multimodal Analysis)을 통해 다양한 입력 방식을 지원하고, 소형 모델의 장점을 활용하여 모바일 환경에서도 쾌적한 사용자 경험을 제공할 수 있을 것으로 보인다.

모델의 한계 및 개선 방향

일부 사용자는 Needle의 모호성 처리 능력(Ambiguity Handling)에 대한 의문을 제기하며, 복잡한 쿼리(Query)에 대한 성능을 우려했다. 또한, 모델의 오류 처리(Error Handling)툴 체이닝(Tool Chaining) 기능의 부재에 대한 지적도 있었다. 개발자는 웹 UI를 통해 사용자 정의 툴(Custom Tool)을 테스트하고, 파인 튜닝(Fine-tuning)을 지원하여 이러한 한계를 극복하려 노력하고 있다.

Show HN: Needle: We Distilled Gemini Tool Calling into a 26M Model

댓글 0

첫 번째 댓글을 남겨보세요!