팀챗 기반 AI 실행 시스템 hollon-ai, 조직의 개발 생산성을 혁신하다!

AI Native 레포 구축 후, 조직 전체가 AI를 활용할 수 있도록 팀챗 기반의 실행 인터페이스인 hollon-ai를 개발

팀챗을 통해 요구사항, 승인, 피드백, 상태 추적을 통합하고, Kubernetes Job을 활용하여 격리된 실행 환경 제공

Claude Code를 코어 루프로 활용하여 코드 탐색, 수정, PR 생성, 테스트 실행 등 핵심 기능을 수행하며, 조직 지식을 축적하는 메모리 시스템 구축

보안 대응, 배포 관측, 코드 수정, 지식 회수 등 다양한 운영 사례를 통해 AI Native 조직으로의 확장을 보여줌

hollon-ai 시스템 아키텍처: 팀챗을 실행 인터페이스로

hollon-ai는 팀챗을 실행 인터페이스(Execution Interface)로 삼아, 조직 내 AI 활용을 위한 통합 환경을 제공한다. API 서버(API Server), orchestrator, worker pod로 구성되며, API 서버는 외부 webhook을 수신하고 스레드 문맥을 복원하며, orchestrator는 실행할 태스크를 스캔하고 worker pod를 생성/회수한다. 실제 작업은 Kubernetes Job으로 실행되는 worker pod에서 이루어지며, API 서버는 상태 관리(State Management)를 담당하고, worker pod는 코드 탐색, 수정, PR 생성 등의 작업을 수행한다. 이러한 구조는 시스템의 수평 확장을 용이하게 하며, 각 컴포넌트의 역할을 명확히 분리하여 유지보수성을 높인다.

Kubernetes Job 기반의 격리된 실행 환경

hollon-ai는 Kubernetes Job을 활용하여 각 태스크에 대해 격리된 실행 환경을 제공한다. 사용자가 팀챗에서 작업을 승인하면 orchestrator가 worker용 K8s Job을 띄우고, init container가 대상 레포를 clone하며, 메인 컨테이너가 에이전트를 실행한다. 작업 중간 상태와 결과는 API 서버에 보고되고, 작업이 완료된 pod는 자동으로 정리된다. 이 구조는 태스크 격리(Task Isolation), 역할별 이미지 구성, 실패한 worker의 재실행을 용이하게 하며, 대화 인터페이스는 팀챗이지만 실제 실행은 Kubernetes 위에서 이루어진다.

Claude Code 활용과 조직 실행 harness

hollon-ai는 Claude Code를 코어 루프로 활용하여 코드 탐색, 수정, 테스트, Git 작업 등 핵심 기능을 수행한다. Claude Code는 이미 안정적인 코딩 harness를 제공하며, hollon-ai는 Claude Code 위에 조직이 실제로 쓸 수 있는 실행 인터페이스(Execution Interface)와 운영 계층을 얹는 데 집중한다. 즉, hollon-ai는 Claude Code를 대체하는 것이 아니라, Claude Code가 조직 안에서 자연스럽게 일하게 만드는 역할을 한다. 이를 통해 팀챗 스레드에서 요구사항과 승인 흐름을 받고, 상태머신으로 작업 흐름을 제어하며, 외부 도구와의 연동을 가능하게 한다.

팀챗 기반의 운영 사례: 보안, 배포, 지식 관리

hollon-ai는 팀챗을 통해 보안 위험 대응, 배포 후 Datadog/Grafana 지표 점검, 조직 지식 조회 등 다양한 운영 사례를 보여준다. 보안 관련하여, 조직 전체의 리스크를 훑고, 영향받는 시스템을 식별하며, 역할별 액션 아이템을 정리한다. 배포 후에는 Datadog, Grafana 지표를 확인하여 이상 여부를 판단하고, 후속 조치가 필요한 항목을 식별한다. 또한, 팀챗에서 조직 지식을 바로 꺼내 쓸 수 있도록 하여, 구현 에이전트이면서 동시에 지식 인터페이스(Knowledge Interface)로 동작한다. 이러한 사례들은 hollon-ai가 단순한 챗봇이 아닌, 조직의 실행 시스템임을 보여준다.

지식 시스템: Supermemory에서 자체 메모리 계층으로

hollon-ai는 세션 밖 기억을 위해 Supermemory를 활용하여 AI가 이전 대화를 기억하도록 하였으며, 자체 메모리 계층을 구축하여 지식 시스템을 강화했다. L1(Claude 세션 컨텍스트), L2(태스크 단위 메모리), L3(레포/서비스 단위 메모리), L4(조직 단위 메모리)로 구성되며, 태스크의 결정, 레포 패턴, 조직 규칙, 운영 중 발견된 사이드 이펙트 등을 누적한다. 벡터 검색, 그래프 검색, 메모리 검색을 통해 코드, 문서, 운영 경험을 연결하여 재사용하는 지식 시스템(Knowledge System)을 구축하고 있으며, 이는 hollon-ai가 단순한 챗봇이 아닌 조직의 학습을 누적하는 기반이 된다.

기술적 도전 과제와 안정성 확보 노력

hollon-ai 개발 과정에서 중복 처리, stale lock, rolling restart 중 false failure, placeholder reply 정리, review loop 복구 등 다양한 안정화 작업이 이루어졌다. 특히, 실패 복구(Failure Recovery)는 hollon-ai의 신뢰성을 확보하는 데 중요한 요소로 작용한다. 사용자는 긴 장애 보고서보다 '지금 믿을 수 있는 상태'를 원하기 때문에, 시스템의 품질은 잘 될 때보다 꼬였을 때 얼마나 자연스럽게 복구되느냐에 달려 있다. 이러한 노력들을 통해 hollon-ai는 안정적인 운영을 위한 기반을 마련하고, 조직 내 AI 활용의 가치를 높였다.