LLM Research Engineer

카카오

판교

네 줄 요약

• **LLM 구조 탐색 및 최적화** 연구 수행 • **비용 효율화 학습 및 데이터 최적화** 연구 • **대규모 LLM 학습 데이터** 수집, 생성 및 관리 기술 개발

LLM

Kanana

Python

PyTorch

TensorFlow

CUDA

Triton

Megatron-LM

DeepSpeed

FSDP

Low-precision training 관련 연구/개발 경험 (e.g., FP8/MXFP4 학습 시 수치 안정성 확보, loss scaling, tensor-wise/block-wise scaling 전략 설계)
Quantization-Aware Training(QAT) 및 저비트 양자화 환경에서의 LLM 학습 경험
Knowledge Distillation을 활용한 모델 압축 연구 경험
LLM 관련 kernel 개발 경험 (e.g., Triton, CUDA 기반 custom kernel)
분산 학습 전략 설계 및 프레임워크(e.g., Megatron-LM, DeepSpeed, FSDP) 기여 경험
LLM 학습 데이터 품질 향상 및 평가 연구 개발 경험
대규모 클러스터 환경에서 초거대 모델 학습 최적화 경험