Qwen3.7-Max, AI 에이전트의 새로운 지평을 열다!

Qwen3.7-Max는 코딩, 사무 자동화, 장기 실행 작업 등 다양한 에이전트 작업을 수행하도록 설계됨

SWE-Pro 60.6점, SWE-Multilingual 78.3점 등 코딩 관련 벤치마크에서 뛰어난 성능을 보임

알리바바 클라우드 모델 스튜디오(Alibaba Cloud Model Studio)를 통해 API로 사용 가능

가격 및 지연 시간(Latency)에 대한 정보 부족과 중국 정부 관련 정보 검열에 대한 커뮤니티 우려 제기

Qwen3.7-Max의 주요 특징 및 성능

Qwen3.7-Max는 코딩 에이전트로서 프런트엔드 프로토타이핑(Frontend Prototyping)부터 복잡한 소프트웨어 엔지니어링까지, 사무 및 생산성 도구로서는 MCP 통합(MCP Integrations) 및 멀티 에이전트 오케스트레이션을 통해, 그리고 장기 실행 작업에서는 35시간 자율 커널 최적화 실행을 통해 그 능력을 입증했다. 특히, 다양한 에이전트 프레임워크에서 일관된 성능을 보이며, 광범위한 벤치마크(Benchmarks)에서 경쟁 모델들을 능가하는 결과를 보여주었다.

자율적인 장기 실행 능력

Qwen3.7-Max는 35시간 동안 1,000회 이상의 도구 호출을 통해 자율적으로 커널 최적화를 수행하는 능력을 보여주었다. 이는 모델이 장기간에 걸쳐 일관된 추론(Coherent Reasoning) 능력을 유지하며, 문제 해결 전략을 지속적으로 개선할 수 있음을 의미한다. Split-KV 병렬 처리(Split-KV Parallelism), 런칭 및 할당 오버헤드 제거, 워크로드 적응형 분할 튜닝 등 다양한 최적화 단계를 거쳐 10배의 속도 향상을 달성했다.

다양한 에이전트 프레임워크 지원

Qwen3.7-Max는 Claude Code, OpenClaw, Qwen Code 등 다양한 에이전트 프레임워크에서 일관된 성능을 제공한다. 이는 특정 프레임워크에 의존하지 않고, 일반화된 문제 해결 전략(Generalizable Problem-solving Strategies)을 학습했음을 시사한다. Cross-Harness Generalization을 통해 다양한 환경에서도 안정적인 성능을 보이며, 에이전트 시스템 구축에 유연성을 제공한다.

커뮤니티의 주요 논쟁 및 우려 사항

커뮤니티에서는 모델의 가격, 지연 시간, 그리고 알리바바 클라우드 모델 스튜디오(Alibaba Cloud Model Studio) 사용 경험에 대한 정보 부족을 지적했다. 또한, 중국 정부 관련 정보 검열 가능성에 대한 우려가 제기되었다. 데이터 미저장 정책(Zero-Retention Policy)과 같은 보안 및 개인 정보 보호에 대한 추가적인 정보가 필요하다는 의견도 나왔다.