GitHub, 개인 저장소 학습? 개발자들의 반발

GitHub이 4월 24일부터 개인 저장소 코드를 AI 학습에 활용하겠다고 발표하여 개발자들의 반발을 샀음

개인 코드의 무단 사용에 대한 우려와 함께, 지적 재산권 침해 가능성이 제기됨

커뮤니티에서는 GitHub의 데이터 미저장 정책(Zero-Retention Policy)에 대한 불신이 커지고 있음

데이터 격리 아키텍처(Data Isolation Architecture) 부재로 인한 보안 취약점 지적

GitHub의 학습 정책 변경 배경

GitHub은 자사 AI 서비스인 Copilot의 성능 향상을 위해 개인 저장소(Private Repositories)의 코드를 학습 데이터로 활용하겠다고 발표했다. 이는 Copilot의 코드 완성(Code Completion) 및 코드 제안(Code Suggestion) 기능을 개선하기 위한 것으로 보인다. 하지만, 데이터 미저장 정책(Zero-Retention Policy)에도 불구하고, 개인 코드의 무단 사용에 대한 우려가 커지고 있다. 특히, 지적 재산권(Intellectual Property) 침해 가능성에 대한 개발자들의 불안감이 높다.

데이터 미저장 정책(Zero-Retention Policy)의 한계

커뮤니티에서는 GitHub의 데이터 미저장 정책(Zero-Retention Policy)에 대한 불신이 팽배하다. GitHub은 학습에 사용된 코드를 저장하지 않는다고 주장하지만, 데이터 격리 아키텍처(Data Isolation Architecture)가 미흡한 경우, 학습 과정에서 발생할 수 있는 보안 취약점에 대한 우려가 제기된다. 특히, Copilot과 같은 AI 서비스는 AI 환각(Hallucination)으로 인해 잘못된 코드를 생성할 수 있으며, 이는 보안 사고로 이어질 수 있다.

개발자들의 반발과 대응 전략

GitHub의 정책 변경에 대해 개발자들은 개인 정보 보호(Data Privacy) 및 지적 재산권(Intellectual Property) 침해를 우려하며 반발하고 있다. GitHub은 옵트 아웃(Opt-out) 방식을 통해 사용자들이 데이터 학습을 거부할 수 있도록 했지만, 자동 옵트인(Automatic Opt-in) 방식은 개발자들의 불만을 더욱 증폭시켰다. 개발자들은 GitHub의 데이터 격리 아키텍처(Data Isolation Architecture) 강화 및 투명한 데이터 처리(Transparent Data Processing)를 요구하고 있다.