OWASP 기반 GenAI 보안 점검 가이드: 100가지 질문으로 안전한 AI 시스템 구축
OWASP는 2025년 LLM Top 10과 2026년 Agentic Top 10을 발표하며, GenAI 보안의 새로운 프레임워크 제시
프롬프트 인젝션(Prompt Injection), 데이터 포이즈닝(Data Poisoning) 등 LLM 및 에이전트 환경의 고유한 위험을 분석하고, 100개의 어세스먼트 질문을 통해 보안 수준 평가
기존 웹 애플리케이션 보안(Web Application Security)만으로는 부족하며, 자율형 멀티 에이전트 시스템(Autonomous Multi-Agent System)의 새로운 위협 모델을 제시
AWS Bedrock Guardrails를 활용한 프롬프트 공격 탐지 및 데이터 보안 강화 방안 제시
100개의 질문을 8개 영역으로 분류하고, 각 영역별 평가 방법 및 우선순위 권장사항 제시
OWASP 프레임워크의 핵심 변화
본문은 기존 OWASP Top 10 for Web Applications만으로는 GenAI 시스템의 고유한 위험을 다룰 수 없다고 지적하며, LLM01(Prompt Injection), ASI01(Agent Goal Hijack) 등 새로운 위협을 강조한다.
LLM01: 프롬프트 인젝션(Prompt Injection)은 LLM의 지시와 데이터 분리 실패로 발생하며, 에이전트 환경에서는 목표 탈취(Goal Hijack)로 확장
공급망 공격(Supply Chain Attack)의 범위가 런타임 요소(MCP 서버, 외부 에이전트)까지 확장됨에 따라, 동적 공급망 관리(Dynamic Supply Chain Management)의 중요성 부각
OWASP는 이러한 변화를 반영하여 LLM Top 10(2025)과 Agentic Top 10(2026)을 발표하고, 상호 보완적인 관계(Complementary Relationship)를 강조한다.
100가지 질문의 8가지 영역 분석
본문은 100개의 질문을 8개 영역으로 분류하여 GenAI 시스템의 보안 수준을 평가하도록 안내한다.
프롬프트 보안(Prompt Security): 프롬프트 인젝션 방어, 시스템 프롬프트 보호 등 14문항으로 구성
데이터 보안(Data Security): 민감 정보 보호, 데이터 포이즈닝 방어 등 13문항으로 구성
모델 및 공급망 보안(Model & Supply Chain Security): 모델 공급망 관리, 모델 보호 및 벡터/임베딩 보안 등 12문항
출력 및 실행 보안(Output & Execution Security): 출력 검증 및 새니타이제이션, 환각/허위 정보 방어, 코드 실행 보안 등 12문항
각 영역은 OWASP 프레임워크의 특정 위험 항목에 매핑되며, 체계적인 보안 점검(Systematic Security Assessment)을 지원한다.
AWS Bedrock Guardrails 활용 방안
본문은 AWS Bedrock Guardrails를 활용한 보안 구현 방안을 제시하며, 특히 프롬프트 공격(Prompt Attack) 및 데이터 보안(Data Security) 강화에 초점을 맞춘다.
Amazon Bedrock Guardrails의 Content Filters는 프롬프트 인젝션 시도를 탐지하고 차단하며, Standard 티어에서는 코드 요소 내 숨겨진 악의적 콘텐츠까지 탐지
Sensitive Information Filters를 통해 PII(개인 식별 정보)를 탐지하여 차단하거나 마스킹 가능
Contextual Grounding Checks를 활용하여 모델 응답의 사실 정확성 검증, RAG 애플리케이션에서 환각(Hallucination) 탐지 및 차단 가능
AWS 환경에서 GenAI 보안을 강화하기 위한 구체적인 방법론을 제시한다.
평가 방법 및 위험도 산정
본문은 100개의 질문에 대한 평가 방법과 위험도 산정 방식을 제시하여, 보안 수준을 객관적으로 평가하도록 돕는다.
각 질문에 대해 예(2점), 부분(1점), 아니오(0점), 해당 없음(N/A)으로 평가
N/A 항목이 많을 경우, 점수율 = (획득 점수 / 적용 가능 최대 점수) * 100%로 계산하여 위험도 산정
90% 이상: 우수(Low Risk), 70~89%: 양호(Medium Risk), 50~69%: 보통(High Risk), 50% 미만: 취약(Critical Risk)으로 분류
평가 결과에 따라 우선순위 권장사항을 제시하여, 효율적인 보안 개선(Efficient Security Improvement)을 지원한다.
게이팅(Gating) 적용 및 필수 기준
본문은 GenAI 보안의 특성을 고려하여, 점수와 별개로 프로덕션 배포 전 반드시 해결해야 할 필수 기준(게이팅)을 제시한다.
런타임 프롬프트 인젝션 방어, 핵심 보안 제어의 코드 레벨 강제, 민감 정보 마스킹/차단, 에이전트 도구 권한 최소화, 출력 검증/새니타이제이션, 불변 감사 로그 등 6가지 영역을 게이팅 항목으로 지정
각 항목에 대한 “예(Y)” 판정을 위한 최소 증거(정책/설계, 구현/설정, 검증 결과, 운영 증거) 제시
게이팅(Gating)을 통해, 전체 점수와 관계없이 핵심 보안 취약점(Critical Security Vulnerabilities)을 사전에 차단하고, 안전한 GenAI 시스템 구축을 돕는다.