올리브영, T4 GPU 1장으로 sLLM 구축 성공!

올리브영은 T4 GPU 1장 환경에서 자체 학습 sLLM을 구축하여, 리뷰 기반 추천 시스템에 도입

Gemma 3-4B 모델을 활용, 상용 LLM 대비 95% 정확도를 유지하며 비용 효율성을 확보

자체 sLLM SFT 방식을 통해 재현성, 버전 관리, 프롬프트 엔지니어링 한계 극복

LoRA 및 QLoRA 기법을 활용하여 16GB VRAM 환경에서의 학습 최적화

향후 더 크고 복잡한 태스크를 위한 대형 모델 학습 및 도메인 확장을 계획

상용 LLM API vs 자체 sLLM: 올리브영의 선택

올리브영은 리뷰 테마 추천 시스템 구축을 위해 상용 LLM API와 자체 sLLM SFT 방식을 비교 분석했다. 재현성(Reproducibility), 버전 통제(Version Control), 운영 비용(Operational Cost) 측면에서 자체 sLLM SFT 방식이 유리하다고 판단했다.

상용 LLM API: 모델 업데이트에 따른 응답 품질 변화, 프롬프트 엔지니어링의 한계, 트래픽 증가 시 비용 급증

올리브영은 T4 GPU 1장 환경에서 자체 학습 sLLM을 구축하여, 리뷰 기반 추천 시스템에 도입

Gemma 3-4B 모델을 활용, 상용 LLM 대비 95% 정확도를 유지하며 비용 효율성을 확보

자체 sLLM SFT 방식을 통해 재현성, 버전 관리, 프롬프트 엔지니어링 한계 극복

LoRA 및 QLoRA 기법을 활용하여 16GB VRAM 환경에서의 학습 최적화

향후 더 크고 복잡한 태스크를 위한 대형 모델 학습 및 도메인 확장을 계획

상용 LLM API vs 자체 sLLM: 올리브영의 선택

상용 LLM API: 모델 업데이트에 따른 응답 품질 변화, 프롬프트 엔지니어링의 한계, 트래픽 증가 시 비용 급증

올리브영, T4 GPU 1장으로 sLLM 구축 성공!

상용 LLM API vs 자체 sLLM: 올리브영의 선택

올리브영, T4 GPU 1장으로 sLLM 구축 성공!

상용 LLM API vs 자체 sLLM: 올리브영의 선택

Google Gemma 4, 오픈소스 AI의 새 기준 제시!

Gemma 4, 이제 로컬에서 Claude Code와 함께!

5년 된 맥북으로 1년 치 비디오 인덱싱, 로컬 LLM의 힘!

Gemma 3-4B 선택: 모델 선정 과정

16GB VRAM 환경을 위한 학습 최적화

프롬프트 단축 실험: 효율적인 프롬프트 구성

sLLM 도입의 주요 성과와 향후 과제

관련 추천 글

Google Gemma 4, 오픈소스 AI의 새 기준 제시!

Gemma 4, 이제 로컬에서 Claude Code와 함께!

5년 된 맥북으로 1년 치 비디오 인덱싱, 로컬 LLM의 힘!

Gemma 4, MTP Drafters로 추론 속도 3배 향상!

Gemma 4, Cloud Run Jobs로 펫 품종 분류 성능 향상!

Cloud Run Jobs로 Gemma 3 Fine-tuning, 서버리스 GPU로 펫 품종 정확도 94% 달성!

댓글 0

Google Gemma 4, 오픈소스 AI의 새 기준 제시!

Gemma 4, 이제 로컬에서 Claude Code와 함께!

5년 된 맥북으로 1년 치 비디오 인덱싱, 로컬 LLM의 힘!

관련 추천 글

Google Gemma 4, 오픈소스 AI의 새 기준 제시!

Gemma 4, 이제 로컬에서 Claude Code와 함께!

5년 된 맥북으로 1년 치 비디오 인덱싱, 로컬 LLM의 힘!

Gemma 4, MTP Drafters로 추론 속도 3배 향상!

Gemma 4, Cloud Run Jobs로 펫 품종 분류 성능 향상!

Cloud Run Jobs로 Gemma 3 Fine-tuning, 서버리스 GPU로 펫 품종 정확도 94% 달성!

댓글 0