자체 배포 모델 개요

Model Garden은 Vertex AI에 배포하고 제공할 수 있는 셀프 배포 개방형 모델과 파트너 모델을 모두 제공합니다. 이러한 모델은 서버리스이며 수동 배포가 필요하지 않은 모델 as a 서비스 (MaaS) 제품과 다릅니다.

모델을 직접 배포하면 Google Cloud 프로젝트 및 VPC 네트워크 내에 안전하게 배포됩니다.

개방형 모델 자체 배포

개방형 모델은 멀티모달 처리에 탁월한 Gemini 모델을 비롯하여 다양한 AI 태스크를 위한 사전 학습된 기능을 제공합니다. 개방형 모델은 자유롭게 사용할 수 있고 출력을 게시할 수 있으며 라이선스 약관을 준수하는 한 모든 곳에서 사용할 수 있습니다. Vertex AI는 개방형 (개방형 가중치라고도 함) 및 오픈소스 모델을 모두 제공합니다.

Vertex AI가 포함된 개방형 모델을 사용하면 인프라에 Vertex AI가 사용됩니다. PyTorch, Jax 등 다른 인프라 제품이 포함된 개방형 모델을 사용할 수도 있습니다.

개방형 가중치 모델

많은 개방형 모델이 개방형 가중치 대규모 언어 모델 (LLM)로 간주됩니다. 개방형 모델은 개방형 가중치가 아닌 모델보다 투명성이 높습니다. 모델의 가중치는 모델의 신경망 아키텍처에 저장되는 숫자 값이며 모델 학습에 사용된 데이터로부터 학습된 패턴과 관계를 나타냅니다. 개방형 가중치 모델의 선행 학습된 매개변수 또는 가중치가 공개됩니다. 추론 및 조정에 개방형 가중치 모델을 사용할 수 있지만 원본 데이터 세트, 모델 아키텍처, 학습 코드와 같은 세부정보는 제공되지 않습니다.

오픈소스 모델

개방형 모델은 오픈소스 AI 모델과 다릅니다. 개방형 모델은 학습된 패턴의 가중치와 핵심적인 수치 표현을 노출하는 경우가 많지만 전체 소스 코드나 학습 세부정보를 제공하지는 않습니다. 가중치를 제공하면 AI 모델을 직접 구축하지 않고도 모델의 기능을 이해할 수 있는 수준의 투명성을 확보할 수 있습니다.

자체 배포 파트너 모델

Model Garden을 사용하면 독점 모델을 자체 배포 옵션으로 제공하는 파트너의 모델 라이선스를 구매하고 관리할 수 있습니다. Cloud Marketplace에서 모델 액세스를 구매한 후에는 주문형 하드웨어에 배포하거나 Compute Engine 예약 및 약정 사용 할인을 사용하여 예산 요구사항을 충족할 수 있습니다. 모델 사용 및 사용 중인 Vertex AI 인프라에 대한 요금이 청구됩니다.

직접 배포 파트너 모델 사용을 요청하려면 Model Garden 콘솔에서 관련 모델을 찾아 영업팀에 문의를 클릭한 후 양식을 작성합니다. 그러면 Google Cloud 영업 담당자와의 연락이 시작됩니다.

파트너 모델 배포 및 사용에 관한 자세한 내용은 파트너 모델 배포 및 예측 요청을 참고하세요.

고려사항

자체 배포 파트너 모델을 사용할 때는 다음 제한사항을 고려하세요.

  • 개방형 모델과 달리 가중치를 내보낼 수 없습니다.
  • 프로젝트에 VPC 서비스 제어가 설정된 경우 모델을 업로드할 수 없어 파트너 모델을 배포할 수 없습니다.
  • 엔드포인트의 경우 공유 공개 엔드포인트 유형만 지원됩니다.

Vertex AI에서 자체 배포된 모델에 대해 자세히 알아보기