AI 스크래핑 공격, IPv4 주소 공간을 집어삼키다!

by DD
1개월 전
조회수 2

웹 스크래핑 공격(Web Scraping Attack)으로 인해 개인 웹사이트가 초당 50회 이상의 요청을 처리하며 서버 과부하 발생

IPv4 주소 공간 시각화(IPv4 Address Space Visualization)를 통해 공격의 광범위한 분포와 규모를 파악

Iocaine과 같은 봇 탐지 도구(Bot Detection Tool)를 활용하여 가짜 데이터를 제공하는 방어 전략 구현

IPv6 미지원(IPv6 Unsupport) 봇이 많아 IPv4 차단이 효과적일 수 있다는 의견 제시

AI 기반 스크래핑 공격의 규모와 특징

공격자는 200만 개 이상의 고유 IP 주소를 사용하여 웹사이트에 대규모 스크래핑 공격을 감행했다. 특히, 전체 IPv4 주소 공간의 1/2000에 해당하는 IP 주소가 공격에 관여했으며, 이는 분산된 공격의 특징을 보여준다. 마이크로소프트(Microsoft)의 IP 주소에서 가장 많은 요청이 발생했으며, 구글(Google)의 IP 주소도 상당수 포함되었다. 이러한 공격은 단일 서버의 CPU 자원을 고갈시켜 서비스 중단을 유발했다.

Iocaine을 활용한 봇 트래핑(Bot Trapping) 전략

저자는 Iocaine을 사용하여 봇을 가짜 데이터로 유도하는 'poison trap' 전략을 사용했다. Iocaine은 봇이 요청하는 URL에 특정 트리거 단어를 포함시켜 가짜 데이터를 생성하고, 이를 통해 봇의 활동을 감지하고 차단한다. Iocaine(봇 트래핑 도구)은 봇의 요청을 처리하는 데 필요한 서버 자원을 최소화하여, 공격으로 인한 서버 과부하를 완화하는 데 기여한다.

IPv4 주소 공간 시각화 및 분석

저자는 IPv4 주소 공간을 시각화하여 공격의 분포를 분석했다. 각 픽셀은 /24 블록을 나타내며, 봇 활동이 많은 블록은 더 밝은 색상으로 표시된다. 이 시각화는 공격의 광범위한 확산과 특정 IP 블록의 집중적인 공격 패턴을 보여준다. Z-order curve를 사용하여 IPv4 주소를 시각화함으로써, 공격 패턴을 직관적으로 파악하고 방어 전략을 수립하는 데 도움을 준다.

IPv6 미지원 봇에 대한 대응 전략

댓글에서는 IPv6를 지원하지 않는 봇이 많다는 점을 지적하며, IPv4를 차단하는 것이 효과적인 방어 방법이 될 수 있다고 제안한다. 이는 DDoS 공격과 유사한 효과를 낼 수 있으며, 공격 트래픽을 줄이는 데 기여할 수 있다. 하지만, IPv4 연결을 사용하는 사용자의 접근성을 제한할 수 있다는 단점도 존재한다. IPv4 차단(IPv4 Blocking)은 공격 방어와 사용자 접근성 사이의 트레이드 오프(Trade-off)를 고려해야 하는 전략이다.

The Day I Logged 1 In Every 2000 Public IPv4: Visualizing The AI Scraper DDoS