LLM 스팸, 신뢰 기반 시스템으로 해결 가능할까?

by DD
1개월 전
조회수 8

Tangled 프로젝트에서 LLM 기반 기여(Contribution) 스팸을 방지하기 위해 vouching 시스템을 도입함

강력한 정책 시행을 통해 스팸을 해결하자는 의견과 신뢰 기반 시스템의 필요성이 대립함

신뢰 신호(Trust Signals)의 유용성에 대한 논의와 함께 악의적인 사용자(Malicious Users)에 대한 대처 방안이 제시됨

시스템의 확장성(Scalability)오용 가능성(Abuse Potential)에 대한 우려가 제기되며, 사회적 측면(Social Aspect)에 대한 고려 필요성이 강조됨

Tangled의 Vouching 시스템: 기술적 구현

Tangled 프로젝트는 LLM 기반 스팸(Spam)을 방지하기 위해 vouching 시스템을 도입했다. 이 시스템은 사용자가 다른 사용자를 vouch 또는 denounce할 수 있도록 하며, vouch된 사용자는 녹색 방패 아이콘, denounce된 사용자는 빨간색 아이콘을 프로필에 표시한다. 데이터 격리 아키텍처(Data Isolation Architecture)를 통해 각 사용자의 vouch/denounce 기록은 PDS(Personal Data Store)에 저장되며, 네트워크 전반에서 집계되어 표시된다.

강력한 정책 vs. 신뢰 기반 시스템

일부 의견에서는 강력한 반 LLM 정책(Anti-LLM Policies) 시행과 GitHub과 같은 플랫폼 탈피를 통해 스팸을 해결해야 한다고 주장한다. 반면, Tangled의 vouching 시스템과 같이 신뢰 신호(Trust Signals)를 활용하여 스팸을 방지하는 접근 방식이 제시되었다. 이러한 시스템은 유지 보수 부담(Maintenance Burden)을 줄이고, LLM 기반의 '언캐니 밸리(Uncanny Valley)' 코드 제출을 식별하는 데 도움을 줄 수 있다.

시스템의 확장성 및 오용 가능성

커뮤니티에서는 vouching 시스템의 확장성(Scalability)오용 가능성(Abuse Potential)에 대한 우려가 제기되었다. 특히, 악의적인 사용자가 대량의 denounce를 통해 시스템을 악용하거나, 평판 농업(Reputation Farming)을 시도할 수 있다는 점이 지적되었다. 이러한 문제를 해결하기 위해 시스템 설계 시 사회적 측면(Social Aspect)을 충분히 고려해야 한다는 의견이 제시되었다.

신뢰의 척도: 인간 vs. 기계

논의에서는 신뢰(Trust)의 본질에 대한 다양한 관점이 제시되었다. LLM이 생성한 정교한 스팸은 인간이 감지하기 어려울 수 있으며, 이는 신뢰 신호의 유용성을 저해할 수 있다. 또한, 저품질 기여(Low-quality Contributions)를 식별하는 데 있어 신뢰 신호가 얼마나 효과적인지에 대한 의문이 제기되었다. 인간의 판단(Human Judgement)자동화된 시스템(Automated System) 간의 균형을 맞추는 것이 중요하다고 강조된다.

combat LLM spam by building a web of trust