코드 검색 에이전트, 98% 토큰 절약! Semble 출시

Semble은 에이전트(Agent)가 코드 검색 시 토큰 사용량 98% 절감 및 빠른 속도를 제공

CPU 기반으로 동작하며, API 키나 GPU 없이 사용 가능하며, Claude Code, Cursor 등과 통합 지원

기존 도구 (grep, CodeRankEmbed) 대비 성능 및 속도 비교 벤치마크를 제공하며, 정확도 99% 달성

실제 에이전트 벤치마크 부재에 대한 아쉬움과, 기존 도구(LSP, colgrep)와의 비교에 대한 커뮤니티의 관심

Semble의 핵심 기술: 토큰 효율성 및 성능

Semble은 Model2Vec 임베딩(Model2Vec Embeddings)과 BM25를 결합하여 코드 검색의 정확성을 높였다. 특히, grep+read 방식 대비 98% 적은 토큰을 사용하며, CPU 환경에서 1.5ms의 빠른 쿼리 속도를 제공한다. 또한, 137M 파라미터 코드 훈련 트랜스포머(Code-trained Transformer)의 99%에 달하는 검색 품질을 달성하여, 토큰 비용(Token Cost)과 성능(Performance) 사이의 균형을 맞췄다.

에이전트 통합 및 사용 편의성

Semble은 MCP(Model-as-a-Code Platform) 서버 형태로 제공되어 Claude Code, Cursor, Codex, OpenCode 등 다양한 에이전트와 쉽게 통합된다. 설치 및 설정이 간편하며, API 키(API Keys)나 GPU 없이 사용 가능하다는 점이 특징이다. 또한, 로컬 경로 또는 Git URL을 통해 코드베이스에 접근할 수 있으며, 자동 인덱싱(Automatic Indexing) 기능을 제공하여 사용성을 높였다.

기존 도구와의 비교 및 경쟁 우위

커뮤니티에서는 Semble이 LSP(Language Server Protocol), colgrep 등 기존 코드 검색 도구와 비교하여 어떤 강점을 가지는지에 대한 질문이 제기되었다. Semble은 빠른 인덱싱 속도(Indexing Speed)와 정확한 검색 결과(Accurate Search Results)를 강조하며, 특히 에이전트 환경에서의 토큰 효율성(Token Efficiency)을 차별점으로 내세운다. 하지만, 실제 에이전트 벤치마크 부재에 대한 아쉬움도 존재한다.

코드 검색 정확도 향상을 위한 기술

Semble은 코드 인식(Code-Aware) 랭킹 신호를 사용하여 검색 정확도를 높인다. 구체적으로, 적응 가중치(Adaptive Weighting), 정의 부스트(Definition Boosts), 식별자 스템(Identifier Stems), 파일 일관성(File Coherence), 노이즈 페널티(Noise Penalties) 등의 기술을 적용하여 검색 결과의 품질을 향상시켰다. 이러한 기술들은 모델 크기(Model Size)를 줄이면서도 정확도를 유지하는 데 기여한다.