LLM Research Engineer

회사: 카카오

위치: 판교

채용 요약

• **LLM 구조 탐색 및 최적화** 연구 수행 • **비용 효율화 학습 및 데이터 최적화** 연구 • **대규모 LLM 학습 데이터** 수집, 생성 및 관리 기술 개발

기술 스택

  • LLM
  • Kanana
  • Python
  • PyTorch
  • TensorFlow
  • CUDA
  • Triton
  • Megatron-LM
  • DeepSpeed
  • FSDP

주요 업무

  • 추론 및 학습에 효율적인 LLM 구조 탐색 및 최적화 연구
  • 비용 효율화를 위한 학습 및 데이터 최적화 연구
  • 비용 효율적인 언어 모델 학습을 위한 알고리즘 연구 및 응용
  • LLM 학습을 위한 대규모 데이터 수집, 생성 및 메타 정보 부착 기술 개발

자격 요건

  • CS/AI/ML 등 관련 전공 석사 이상 또는 이에 준하는 관련 프로젝트 경험
  • Data/Model/Pipeline/Context/Expert Parallel 등 Model parallel 기반의 모델 학습 경험
  • 연구/개발에 대한 지속적인 관심과 새로운 기술/업무에 대한 도전 정신
kakao
6/18/2026

LLM Research Engineer

카카오
|
판교

네 줄 요약

• **LLM 구조 탐색 및 최적화** 연구 수행 • **비용 효율화 학습 및 데이터 최적화** 연구 • **대규모 LLM 학습 데이터** 수집, 생성 및 관리 기술 개발

기술 스택

LLM
Kanana
Python
PyTorch
TensorFlow
CUDA
Triton
Megatron-LM
DeepSpeed
FSDP

주요 업무

  • 추론 및 학습에 효율적인 LLM 구조 탐색 및 최적화 연구
  • 비용 효율화를 위한 학습 및 데이터 최적화 연구
  • 비용 효율적인 언어 모델 학습을 위한 알고리즘 연구 및 응용
  • LLM 학습을 위한 대규모 데이터 수집, 생성 및 메타 정보 부착 기술 개발

자격 요건

  • CS/AI/ML 등 관련 전공 석사 이상 또는 이에 준하는 관련 프로젝트 경험
  • Data/Model/Pipeline/Context/Expert Parallel 등 Model parallel 기반의 모델 학습 경험
  • 연구/개발에 대한 지속적인 관심과 새로운 기술/업무에 대한 도전 정신

우대 사항

  • Low-precision training 관련 연구/개발 경험 (e.g., FP8/MXFP4 학습 시 수치 안정성 확보, loss scaling, tensor-wise/block-wise scaling 전략 설계)
  • Quantization-Aware Training(QAT) 및 저비트 양자화 환경에서의 LLM 학습 경험
  • Knowledge Distillation을 활용한 모델 압축 연구 경험
  • LLM 관련 kernel 개발 경험 (e.g., Triton, CUDA 기반 custom kernel)
  • 분산 학습 전략 설계 및 프레임워크(e.g., Megatron-LM, DeepSpeed, FSDP) 기여 경험
  • LLM 학습 데이터 품질 향상 및 평가 연구 개발 경험
  • 대규모 클러스터 환경에서 초거대 모델 학습 최적화 경험