LLM 미세 조정을 위한 간편한 SDK 및 예제 제공

by DD
5개월 전
조회수 6

Tinker는 LLM(Language Model)을 미세 조정하기 위한 SDK를 제공함

Tinker Cookbook은 Tinker API를 활용한 다양한 미세 조정 예제를 포함

강화 학습(RL), 도구 사용 등 LLM 성능 향상을 위한 다양한 레시피 제공

분산 학습의 추상화

Tinker는 분산 학습의 복잡성을 추상화하여 사용자가 API 요청만으로 LLM을 미세 조정할 수 있도록 지원한다. 구체적으로 데이터 병렬 처리, 모델 병렬 처리 등의 기술을 내부적으로 처리하여 사용자는 학습 알고리즘에 집중할 수 있다. 따라서 학습 인프라 관리에 대한 부담을 줄여준다.

다양한 미세 조정 레시피

Tinker Cookbook은 지도 학습(SL), 강화 학습(RL), 도구 사용 등 다양한 LLM 미세 조정 예제를 제공한다. 구체적으로 Tulu3와 같은 대화형 데이터셋을 활용한 SL, 수학 문제 풀이를 통한 LLM 추론 능력 향상, RLHF 파이프라인 구현 예시를 제공한다. 따라서 사용자는 다양한 LLM 튜닝 기법을 학습하고 적용할 수 있다.

평가 및 유틸리티

Tinker는 모델 평가를 위한 유틸리티를 제공하여, InspectAI와의 통합을 통해 표준 벤치마크를 쉽게 평가할 수 있도록 지원한다. 구체적으로 renderers를 통해 토큰을 구조화된 채팅 메시지 객체로 변환하고, hyperparam_utils를 통해 LoRA에 적합한 하이퍼파라미터를 계산한다. 따라서 모델 성능 측정개선을 위한 효율적인 환경을 제공한다.

thinking-machines-lab / tinker-cookbook