채용 목록으로

kakao

6/12/2026

AI 추론/학습 효율화 엔지니어

카카오

|

판교

네 줄 요약

• **LLM/LMM 서버 추론 성능 개선** 및 학습 효율 증진 • **NVIDIA GPU 아키텍처** 기반 최적화 경험 보유 • **Python** 기반 AI 모델 개발 및 운영 경험

기술 스택

Python

LLM

LMM

NVIDIA GPU

CUDA

Docker

Kubernetes

주요 업무

LLM/LMM 서버 환경 추론 성능 개선
LLM 학습 성능 개선
AI 모델의 서버 및 모바일 환경 추론 적용

자격 요건

Python 언어 능숙자
관련 업계 경력 2년 이상
LLM/LMM 서버 추론 운영 및 효율 개선 경험
NVIDIA GPU 아키텍처, 메모리 계층 구조, 멀티 GPU 통신 실무 지식 보유

우대 사항

CUDA, CUTLASS, Triton, CuTe 등 하위 수준 프로그래밍 경험
LLM/LMM 서버 추론 기술에 대한 높은 이해도
LLM/LMM 모바일(iOS/aOS) 환경 추론 기술 경험
LLM/LMM 학습 프레임워크 경험
오픈소스 프로젝트 기여 경험
주요 학회 논문 게재 경험 (NeurIPS, ICML, ICLR, ACL, CVPR 등)
관련 분야 석사 또는 박사 학위
Docker, Kubernetes 등 클라우드 환경 경험