클로드 코드(Claude Code)의 성능 저하, 사고 과정 축소가 문제?

by DD
2개월 전
조회수 78

클로드(Claude)의 코드 생성 모델인 클로드 코드(Claude Code)가 2월 업데이트 이후 복잡한 엔지니어링 작업에서 신뢰성 저하 문제를 겪고 있음

사고 과정(Thinking)의 축소로 인해 모델이 코드 분석(Code Analysis)을 소홀히 하고, '가장 단순한 해결책'을 선택하는 경향이 증가

사용자들은 모델의 지나친 단순화(Oversimplification)잦은 오류(Frequent Errors)를 지적하며, 이전 버전으로의 회귀를 요구

일부 사용자는 Anthropic의 GPU 자원 부족을 원인으로 추측하며, 모델 성능 저하에 대한 불만을 표출

사고 과정(Thinking) 축소와 성능 저하의 상관관계

보고서에 따르면, 클로드 코드(Claude Code)의 사고 과정(Thinking) 축소는 성능 저하의 주요 원인으로 지목된다. 특히, 사고 과정(Thinking) 토큰의 감소는 모델이 멀티 스텝 연구(Multi-step Research), 규칙 준수(Convention Adherence), 그리고 정교한 코드 수정(Careful Code Modification)을 수행하는 데 필수적인 요소임을 시사한다. 실제 사례로, 사고 과정(Thinking) 깊이가 감소하면서 모델의 코드 읽기(Code Reading)코드 수정(Code Editing) 비율이 70% 감소했다는 분석이 제시되었다. 이는 모델이 코드 컨텍스트를 충분히 파악하지 않고 수정을 시도하는 경향을 보이며, 결과적으로 오류 발생 빈도를 높이는 것으로 이어진다.

코드 수정 방식의 변화: 정밀성 감소

클로드 코드(Claude Code)는 사고 과정(Thinking) 축소 이후, 코드 수정 시 전체 파일 재작성(Full-file Rewrite) 빈도가 증가했다. 이는 모델이 정밀한 수정(Surgical Edit) 대신, 전체 파일을 다시 작성하는 방식을 선택하는 경향을 보인다는 것을 의미한다. 이러한 변화는 코드의 컨텍스트 인식(Context Awareness) 부족으로 이어져, 기존 코드와의 호환성 문제를 야기할 수 있다. 특히, 주석 처리와 관련된 문제 발생 빈도가 높아졌으며, 이는 모델이 코드의 구조를 제대로 이해하지 못하고 있음을 시사한다.

사용자 경험 저하: 오류 증가 및 불만 증가

사용자들은 클로드 코드(Claude Code)의 성능 저하로 인해 오류 발생 빈도 증가(Increased Error Frequency)작업 중단(Work Interruption)을 경험하고 있다. 모델이 스스로 오류를 인정하는 빈도가 증가했으며, 이는 모델의 자기 검토 능력(Self-Review Capability) 저하를 의미한다. 또한, 사용자는 모델의 '가장 단순한 해결책(Simplest Fix)' 선택 경향을 지적하며, 이는 장기적으로 코드 품질 저하를 초래할 수 있다고 우려한다. 댓글에서는, 모델의 성능 저하로 인해 긍정적인 감성(Positive Sentiment) 비율이 32% 감소했다는 분석도 제시되었다.

Anthropic의 대응 및 향후 전망

커뮤니티에서는 Anthropic이 클로드 코드(Claude Code)의 성능 저하에 대한 문제를 인지하고, 개선을 위한 노력을 기울일 것을 기대하고 있다. 특히, 사고 과정(Thinking) 토큰 할당에 대한 투명성 확보와, 복잡한 엔지니어링 워크플로우(Engineering Workflow)를 위한 '최대 사고(Max Thinking)' 옵션 제공을 요구하는 목소리가 높다. 또한, 사용자들은 모델의 성능 변화를 모니터링할 수 있는 지표(Metrics) 제공을 요청하며, 이는 모델의 품질을 지속적으로 관리하고 개선하는 데 기여할 수 있을 것이다.

Claude Code is unusable for complex engineering tasks with the Feb updates