유튜브 댓글, 이제 RAG로 분석하세요!

by DD
9개월 전
조회수 10

YouTube 댓글의 정보 과부하 문제를 해결하기 위해 RAG 시스템을 구축함

LangGraph를 활용하여 댓글 수집, 쿼리 분석, 검색, 응답 생성 과정을 Orchestration

Gemini 2.5 Flash를 통해 질문에 대한 자연어 답변을 생성하고, 긍정/부정 감정 분석 지원

LangGraph를 활용한 워크플로우 설계

LangGraph는 복잡한 RAG 시스템의 워크플로우를 상태 기반 그래프로 표현한다. 구체적으로 댓글 수집, 쿼리 분석, 검색, 응답 생성 단계를 노드로 정의하고, 조건부 라우팅을 통해 유연성을 확보한다. 따라서 유지보수성확장성을 동시에 잡았다.

Qdrant를 이용한 의미 기반 검색

Qdrant는 빠른 벡터 유사도 검색을 제공하여 댓글 임베딩을 효율적으로 검색한다. YouTube API로 수집한 댓글을 임베딩하여 저장하고, 사용자 질문에 대해 의미적으로 유사한 댓글을 찾아낸다. 반면, 임베딩 품질은 언어 혼합 환경에서 개선이 필요하다.

RAG 시스템의 한계와 개선 방향

현재 시스템은 키워드 기반 쿼리 타입 분류고정된 검색 전략을 사용한다. 따라서 LLM을 활용한 의미 기반 분류와 동적 검색 전략 도입이 필요하다. 또한, 증분 업데이트 방식을 통해 댓글 재수집의 비효율성을 개선해야 한다.

특정 YouTube 영상의 댓글에 대한 자연어 분석 RAG 시스템 개발 with LangGraph + Qdrant

댓글 0

첫 번째 댓글을 남겨보세요!