웹 스크래퍼를 속이는 이탈리아식 스팸 생성기, Supercazzola!

by DD
3개월 전
조회수 8

Supercazzola는 웹 스크래퍼를 속이기 위해 동적으로 웹페이지를 생성하는 도구임

FreeBSDGNU/Linux 환경에서 작동하며, Cmake, pkg-config, libevent2에 의존함

Markov chain을 활용하여 무작위 문장을 생성하고, 스팸 페이지를 제공함

설정 파일(Configuration File)을 통해 동작을 제어하며, 로봇 배제(robots.txt)를 권장함

Supercazzola의 기술적 아키텍처

Supercazzola는 Markov chain을 기반으로 무작위 텍스트를 생성하여 웹 스크래퍼를 방해한다. mchain(1) 유틸리티는 텍스트 파일을 입력받아 Markov chain을 생성하고, spamd(8) 데몬은 이 체인을 사용하여 동적으로 HTML 페이지를 생성한다. 특히, X-Forwarded-For 헤더(X-Forwarded-For Header)를 지원하여 방문자 정보를 수집하고, robots.txt를 통해 스팸 페이지 접근을 유도하는 전략을 사용한다.

설치 및 설정 과정

소프트웨어는 Cmake를 사용하여 빌드되며, pkg-config 및 libevent2 라이브러리에 의존한다. 설치 과정은 FreeBSD 시스템을 기준으로 설명되어 있으며, GNU/Linux에서도 유사하게 적용 가능하다. 설정 파일(Configuration File)을 통해 데몬의 동작을 제어하며, bind address, TCP backlog, 최대 문장 길이 등을 설정할 수 있다. 로깅(Logging)은 syslog(3)를 통해 이루어진다.

커뮤니티 반응 및 개선 사항

커뮤니티에서는 Supercazzola의 독창적인 이름과 아이디어에 대한 긍정적인 반응이 주를 이룬다. Ubuntu에서 컴파일 시 발생하는 문제에 대한 해결책이 제시되었으며, 개발자는 이에 대한 피드백을 수렴하여 개선할 의지를 밝혔다. Easter egg 발견에 대한 언급도 있었으며, 향후 릴리스를 통해 설정 파일(Configuration File) 로드 및 git 버전 관리 기능이 추가될 예정이다.

Supercazzola - Generate spam for web scrapers