AI 추론/학습 효율화 엔지니어

회사: 카카오

위치: 판교

채용 요약

• **LLM/LMM 서버 추론 성능 개선** 및 학습 효율 증진 • **NVIDIA GPU 아키텍처** 기반 최적화 경험 보유 • **Python** 기반 AI 모델 개발 및 운영 경험

기술 스택

  • Python
  • LLM
  • LMM
  • NVIDIA GPU
  • CUDA
  • Docker
  • Kubernetes

주요 업무

  • LLM/LMM 서버 환경 추론 성능 개선
  • LLM 학습 성능 개선
  • AI 모델의 서버 및 모바일 환경 추론 적용

자격 요건

  • Python 언어 능숙자
  • 관련 업계 경력 2년 이상
  • LLM/LMM 서버 추론 운영 및 효율 개선 경험
  • NVIDIA GPU 아키텍처, 메모리 계층 구조, 멀티 GPU 통신 실무 지식 보유
kakao
6/12/2026

AI 추론/학습 효율화 엔지니어

카카오
|
판교

네 줄 요약

• **LLM/LMM 서버 추론 성능 개선** 및 학습 효율 증진 • **NVIDIA GPU 아키텍처** 기반 최적화 경험 보유 • **Python** 기반 AI 모델 개발 및 운영 경험

기술 스택

Python
LLM
LMM
NVIDIA GPU
CUDA
Docker
Kubernetes

주요 업무

  • LLM/LMM 서버 환경 추론 성능 개선
  • LLM 학습 성능 개선
  • AI 모델의 서버 및 모바일 환경 추론 적용

자격 요건

  • Python 언어 능숙자
  • 관련 업계 경력 2년 이상
  • LLM/LMM 서버 추론 운영 및 효율 개선 경험
  • NVIDIA GPU 아키텍처, 메모리 계층 구조, 멀티 GPU 통신 실무 지식 보유

우대 사항

  • CUDA, CUTLASS, Triton, CuTe 등 하위 수준 프로그래밍 경험
  • LLM/LMM 서버 추론 기술에 대한 높은 이해도
  • LLM/LMM 모바일(iOS/aOS) 환경 추론 기술 경험
  • LLM/LMM 학습 프레임워크 경험
  • 오픈소스 프로젝트 기여 경험
  • 주요 학회 논문 게재 경험 (NeurIPS, ICML, ICLR, ACL, CVPR 등)
  • 관련 분야 석사 또는 박사 학위
  • Docker, Kubernetes 등 클라우드 환경 경험