토스, 코딩 에이전트 Skill 품질 관리 시스템을 만들다

코딩 에이전트용 Skill이 본문에는 트리거 정보를 담지만 Description에는 없어서 호출 실패(Trigger Failure)가 발생하는 구조적 문제를 발견함\n• 30개 항목을 규칙 검사 17개 + 모델 판정 13개로 분리하여 결정적 결함은 정규식으로, 의미적 품질은 LLM으로 검증하는 이원화 검증 구조(Two-Phase Verification)를 도입함\n• BLOCKER가 하나라도 있으면 무조건 F 등급으로 Merge를 차단하는 단순화 게이트(Simplified Gate) 전략으로 리뷰어 부담을 경감함\n• GitHub Actions의 Sticky Comment와 로컬 Claude Code 플러그인으로 CI/CD 파이프라인과 개발자 워크플로우를 통합함\n• references/ 분리 미흡으로 호출 시 4-5천 토큰을 소비하는 케이스를 줄이기 위해 3단 분리 원칙(3-Tier Separation)을 권장

이원화 검증 아키텍처: 규칙 vs 모델의 책임 분리

본 시스템의 핵심 설계 원칙은 결정적(Deterministic) 결함과 의미적(Semantic) 결함의 분리에 있다. name이 kebab-case가 아닌 경우나 frontmatter 누락은 정규식 한 줄로 100% 검출되지만, "description이 본문의 트리거 조건을 커버하는가"는 모델의 문맥 이해가 필요하다.

규칙 검사를 먼저 실행하여 BLOCKER를 거르면 LLM 비용이 발생하지 않는 구조로, 비용 효율성과 정확도를 동시에 달성한다. 이는 컴파일 타임 vs 런타임 체크의 분리처럼 검증 시점을 분리하는 전략과 유사하다. 실무에서 트리거 패턴을 "when", "할 때", "사용 시" 등의 키워드로 정규식 검출을 시도했으나, 이모지나 완곡한 표현 등 False Positive가 급증하여 결국 모델 판정으로 전환했다. 키워드 매칭의 한계가 드러난 사례이다.

BLOCKER 게이트의 단순화 전략

{"deep_dive": [{"content": "등급 체계에서 가장 중요한 설계는 BLOCKER 하나 = 무조건 F 규칙이다. 이는 미세한 등급 차이로 인한 논쟁을 차단하고, Merge 차단 여부를 단일 비트로 결정하게 만든다.\n트리거 실패, 형식 위반, secret 노출은 모두 사람의 눈으로 발견하기 어려운 결함이다. 코드라면 컴파일러가 잡아주지만, Skill에는 1차 게이트가 없어 조용히 누적된다. 블록커 게이트를 두는 이유는 이러한 잠복 결함(Latent Defect)을 자동화 없이 발견하기 거의 불가능하기 때문이다. 섹션별 BLOCKER 분포(구조 5개, 트리거 1개, 안전성 2개)를 보면, 형식과 보안에 가장 강한 제약을 둔 것이 특징적이다."}]}

토스, 코딩 에이전트 Skill 품질 관리 시스템을 만들다

이원화 검증 아키텍처: 규칙 vs 모델의 책임 분리

BLOCKER 게이트의 단순화 전략

Claude Code, 스킬 구축 노하우 공개

잊지 마세요! 잊지 않고 복권 응모하는 자동화 스크립트

Trivy GitHub Actions 공격, CI/CD 파이프라인을 노리다!

3단 분리 원칙과 컨텍스트 비용 관리

정규식에서 모델 판정으로의 전환 과정

GitHub Actions 통합과 Reusable Workflow 설계

안전성 섹션의 False Negative-zero 전략

관련 추천 글

Claude Code, 스킬 구축 노하우 공개

잊지 마세요! 잊지 않고 복권 응모하는 자동화 스크립트

Trivy GitHub Actions 공격, CI/CD 파이프라인을 노리다!

AI 코드 도구, Claude Code vs MCP, 당신의 선택은?

Claude Code, 개발 도구 선택의 숨겨진 의도?

Claude Code, 실수로 삭제된 파일, 이제 복구하세요!

댓글 0

관련 추천 글

Claude Code, 스킬 구축 노하우 공개

잊지 마세요! 잊지 않고 복권 응모하는 자동화 스크립트

Trivy GitHub Actions 공격, CI/CD 파이프라인을 노리다!

AI 코드 도구, Claude Code vs MCP, 당신의 선택은?

Claude Code, 개발 도구 선택의 숨겨진 의도?

Claude Code, 실수로 삭제된 파일, 이제 복구하세요!

Claude Code, 스킬 구축 노하우 공개

잊지 마세요! 잊지 않고 복권 응모하는 자동화 스크립트

Trivy GitHub Actions 공격, CI/CD 파이프라인을 노리다!

댓글 0