모바일, 웹, 데스크톱 등 다양한 플랫폼에서 AI/ML 기능을 쉽게 구현하세요!

by DD
4개월 전
조회수 52

미디어파이프(MediaPipe)는 구글(Google)에서 개발한 온디바이스(On-device) 머신러닝(Machine Learning) 프레임워크

모바일(Android, iOS), 웹, 데스크톱, 엣지 디바이스(Edge Devices) 및 IoT 등 다양한 플랫폼을 지원하여 AI/ML 솔루션 배포를 용이하게 함

비전(Vision), 텍스트(Text), 오디오(Audio) 관련 작업을 위한 다양한 솔루션과 툴을 제공하여 개발 편의성을 높임

다양한 플랫폼 지원을 위한 아키텍처

미디어파이프(MediaPipe)는 C++ 기반 프레임워크(Framework)로, Android, iOS, 웹, 데스크톱 등 다양한 플랫폼을 지원한다. 이는 계산 그래프(Computation Graph) 기반 아키텍처를 통해 가능하며, 각 플랫폼에 맞게 최적화된 연산(Optimized Operations)을 수행한다. 또한, 미리 훈련된 모델(Pre-trained Models)API를 제공하여 개발자가 쉽게 AI/ML 기능을 통합할 수 있도록 지원한다.

미디어파이프(MediaPipe) 솔루션의 구성

미디어파이프(MediaPipe)는 미디어파이프 태스크(MediaPipe Tasks), 미디어파이프 모델(MediaPipe Models), 미디어파이프 모델 메이커(MediaPipe Model Maker), 미디어파이프 스튜디오(MediaPipe Studio)로 구성된다. 미디어파이프 태스크(MediaPipe Tasks)는 솔루션 배포를 위한 크로스 플랫폼 API(Cross-platform API)를 제공하며, 미디어파이프 모델(MediaPipe Models)은 각 솔루션에 사용되는 사전 훈련된 모델(Pre-trained Models)을 제공한다. 미디어파이프 모델 메이커(MediaPipe Model Maker)는 사용자 데이터로 모델을 커스터마이징(Customizing)할 수 있도록 지원하며, 미디어파이프 스튜디오(MediaPipe Studio)는 솔루션의 시각화, 평가, 벤치마킹을 위한 웹 기반 도구(Web-based Tool)를 제공한다.

계산 그래프(Computation Graph) 기반 파이프라인

미디어파이프(MediaPipe)는 계산 그래프(Computation Graph)를 사용하여 효율적인 온디바이스(On-device) 머신러닝(Machine Learning) 파이프라인을 구축한다. 계산 그래프(Computation Graph)는 데이터 처리 단계를 노드(Node)와 엣지(Edge)로 표현하며, 각 노드는 계산(Calculation)을 수행하고 엣지는 데이터 흐름을 정의한다. 이러한 구조는 병렬 처리(Parallel Processing)최적화(Optimization)를 용이하게 하며, 다양한 플랫폼에서 높은 성능(High Performance)을 보장한다.

미디어파이프(MediaPipe) 프레임워크(Framework) 핵심 개념

미디어파이프(MediaPipe) 프레임워크(Framework)는 패킷(Packets), 그래프(Graphs), 계산기(Calculators)라는 세 가지 핵심 개념을 기반으로 한다. 패킷(Packets)은 데이터의 기본 단위이며, 그래프(Graphs)는 계산기(Calculators)를 연결하여 데이터 처리 파이프라인을 구성한다. 계산기(Calculators)는 패킷(Packets)을 입력으로 받아 처리하고, 결과를 다른 패킷(Packets)으로 출력한다. 이러한 구조는 모듈화(Modularization)재사용성(Reusability)을 높여준다.

google-ai-edge / mediapipe