AI 추론/학습 효율화 엔지니어
회사: 카카오
위치: 판교
채용 요약
• **LLM/LMM 서버 추론 성능 개선** 및 학습 효율 증진 • **NVIDIA GPU 아키텍처** 기반 최적화 경험 보유 • **Python** 기반 AI 모델 개발 및 운영 경험
기술 스택
- Python
- LLM
- LMM
- NVIDIA GPU
- CUDA
- Docker
- Kubernetes
주요 업무
- LLM/LMM 서버 환경 추론 성능 개선
- LLM 학습 성능 개선
- AI 모델의 서버 및 모바일 환경 추론 적용
자격 요건
- Python 언어 능숙자
- 관련 업계 경력 2년 이상
- LLM/LMM 서버 추론 운영 및 효율 개선 경험
- NVIDIA GPU 아키텍처, 메모리 계층 구조, 멀티 GPU 통신 실무 지식 보유