Mistral Medium 3.5, 오픈소스 LLM 시장에 새로운 바람을 불어넣을까?

by DD
1개월 전
조회수 20

Mistral AI가 128B 파라미터(Parameter)의 새로운 모델, Mistral Medium 3.5를 공개하며, 코딩 에이전트(Coding Agent) 기능을 강화함

오픈 가중치(Open Weights)수정된 MIT 라이선스(Modified MIT License)를 통해 접근성을 높였으나, 가격 경쟁력에 대한 의문 제기

SWE-Bench Verified 벤치마크에서 경쟁 모델 대비 우수한 성능을 보였지만, 일부 사용자는 성능 및 기능 개선에 대한 아쉬움을 표함

클라우드 기반 코딩 에이전트(Cloud-based Coding Agent)의 Windows 지원 부족 및 CSP 헤더(CSP Headers) 문제 등, 사용성 측면의 개선 필요성 제기

Mistral Medium 3.5의 기술적 특징

Mistral Medium 3.5는 128B 파라미터(Parameter)의 밀집 모델(Dense Model)로, 256k 컨텍스트 윈도우(Context Window)를 지원하며, 명령어 따르기, 추론, 코딩 능력을 통합했다. 특히, 4개의 GPU(Graphics Processing Units)만으로도 자체 호스팅이 가능하여, VRAM(Video RAM) 제약을 받는 개발자들에게 매력적인 선택지가 될 수 있다. 하지만, 일부 사용자는 CSP 헤더(CSP Headers) 문제로 인해 웹 환경에서의 사용에 어려움을 겪고 있다고 지적했다.

오픈소스 모델로서의 경쟁력

Mistral Medium 3.5는 수정된 MIT 라이선스(Modified MIT License) 하에 오픈 가중치(Open Weights)로 출시되어, 접근성을 높였다. 경쟁 모델(Competitive Model) 대비 적은 자원(Resource)으로도 준수한 성능을 제공한다는 평가를 받지만, 가격 경쟁력에 대한 의문도 제기된다. 특히, API 가격이 다른 모델에 비해 높게 책정되어, 비용 효율성(Cost Efficiency) 측면에서 개선의 여지가 있다는 의견이 존재한다.

성능 벤치마크 및 실제 사용 사례

Mistral Medium 3.5는 SWE-Bench Verified 벤치마크에서 높은 점수를 기록하며, Devstral 2 및 Qwen3.5 397B A17B와 같은 모델을 앞섰다. 또한, τ³-Telecom 벤치마크에서도 91.4점을 획득하며, 에이전트(Agent)로서의 잠재력을 입증했다. 하지만, 일부 사용자는 프랑스어 문법(French Grammar) 관련 질문에 대한 부정확한 답변을 지적하며, 모델의 언어 이해 능력(Language Understanding)에 대한 개선을 요구했다.

클라우드 기반 코딩 에이전트(Cloud-based Coding Agent)의 활용

Mistral은 Le Chat 및 Vibe CLI를 통해 클라우드 기반 코딩 에이전트(Cloud-based Coding Agent)를 제공하며, 개발자가 원격으로 코딩 작업을 수행할 수 있도록 지원한다. Vibe CLI는 Windows 지원이 미흡하다는 지적과 함께, 코드 자동 완성(Code Completion) 기능의 정확성 문제도 제기되었다. 이러한 문제점들은 사용자 경험(User Experience)을 저해하는 요소로 작용하며, 개선이 필요하다는 의견이 지배적이다.

Mistral Medium 3.5