LLM, 매직 더 개더링(Magic: The Gathering)을 배우다!

LLM(대규모 언어 모델)을 활용하여 매직 더 개더링(Magic: The Gathering) 게임을 자동화하는 프로젝트가 등장

XMage 기반의 mage-bench를 통해 다양한 게임 형식(Commander, Standard 등) 지원

게임 플레이 수준(Level of Play)에 대한 커뮤니티의 다양한 의견 제시

덱 평가(Deck Evaluation) 및 게임 데이터 활용에 대한 기대감

LLM 기반 게임 플레이 아키텍처

본 프로젝트는 XMage 게임 서버를 활용하여 LLM이 게임 상태를 파악하고 액션을 선택하도록 설계되었다. XMage는 매직 더 개더링(Magic: The Gathering)의 모든 규칙을 적용하며, LLM은 게임 상태(Game State)와 사용 가능한 액션(Available Actions)을 기반으로 의사 결정을 내린다. 이는 LLM이 복잡한 규칙을 이해하고 적용해야 함을 의미하며, 게임 엔진(Game Engine)은 LLM의 선택을 검증하고 규칙을 준수하도록 한다.

게임 플레이 수준 및 한계

커뮤니티에서는 LLM의 게임 플레이 수준에 대한 다양한 평가가 존재한다. 특히, Legacy와 같은 복잡한 형식에서 LLM의 전략적 이해 부족을 지적하며, 멀리건(Mulligan)과 같은 기본적인 전략조차 제대로 수행하지 못하는 경우를 예시로 들었다. 이는 LLM이 장기적인 전략(Long-term Strategy)을 수립하고, 상황 판단(Situational Awareness) 능력을 향상시켜야 함을 시사한다.

덱 평가 및 데이터 활용 가능성

일부 사용자는 LLM을 활용하여 덱의 성능을 평가하고, 덱 구성의 변화에 따른 결과를 시뮬레이션하는 데 기대를 표했다. 특히, 커맨더(Commander)와 같이 협력과 전략적 판단이 중요한 형식에서 LLM의 역할이 중요할 것으로 예상된다. 또한, 17 Lands와 같은 데이터셋을 활용하여 LLM의 학습 데이터를 구축하고, 게임 데이터(Game Data)를 분석하여 덱의 강점과 약점을 파악하는 데 활용할 수 있다.

기술적 과제 및 향후 전망

LLM 기반 매직 더 개더링(Magic: The Gathering) 자동화는 AI 환각(Hallucination), 계산 비용(Computational Cost), 모델의 일반화(Model Generalization) 등 여러 기술적 과제를 안고 있다. 하지만, 게임은 AI의 성능을 평가하는 좋은 벤치마크가 될 수 있으며, 장기적인 전략(Long-term Strategy)을 요구하는 게임에서 LLM의 발전 가능성을 보여준다. 또한, 오픈소스(Open Source) 커뮤니티의 기여를 통해 지속적인 개선이 이루어질 것으로 예상된다.