使用 gcloud CLI 建立深度學習 VM 執行個體

本頁面說明如何使用 Google Cloud CLI 建立深度學習 VM 映像檔執行個體。

事前準備

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. 如要使用 Google Cloud CLI 進行本快速入門,您必須先安裝並初始化 Google Cloud CLI

    1. 按照「安裝 Google Cloud CLI」一文中的指示下載並安裝 Google Cloud CLI。
    2. 按照初始化 Cloud SDK 一文中的指示初始化 SDK。

    如要在 Cloud Shell 中使用 gcloud 進行本快速入門導覽課程,請先按照啟動 Cloud Shell 一文中的指示啟動 Cloud Shell。

建立新執行個體

以下操作說明會建立具有下列參數的深度學習 VM 執行個體:

  • 在 CUDA 9.2 映像檔上使用 TensorFlow:tf-latest-cu92
  • 位在美國 West1-B 區域中:us-west1-b
  • 名稱為 my-new-instance
  • 屬於執行個體類型 n1-standard-8
  • 使用 NVIDIA Tesla V100 GPUtype=nvidia-tesla-v100,count=8
  • 具有 120 GB 的開機磁碟。
  • 具有會在首次執行時安裝的 NVIDIA GPU 驅動程式:install-nvidia-driver=True

在指令列中,輸入以下內容:

export IMAGE_FAMILY="tf-latest-cu92"
export ZONE="us-west1-b"
export INSTANCE_NAME="my-new-instance"
export INSTANCE_TYPE="n1-standard-8"
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=8" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=120GB \
        --metadata="install-nvidia-driver=True"

經過一段時間後,系統會建立 VM 執行個體並顯示其設定摘要。

您剛剛建立了第一個深度學習 VM 執行個體。如要驗證執行個體確實存在並查看其狀態,請使用 gcloud list 指令 (如下所示) 列出所有執行個體:

gcloud compute instances list

這會顯示目前專案中所有區域的所有 Compute Engine 執行個體。

您也可以在Google Cloud 主控台的 Compute Engine VM 執行個體頁面中,查看及維護深度學習 VM 執行個體。

如要只查看這個執行個體的狀態,請使用以下指令:

gcloud compute instances describe $INSTANCE_NAME

存取新執行個體

深度學習 VM 執行個體在建立完成後會自動啟動。您可以使用以下指令,透過 SSH 存取該執行個體:

gcloud compute ssh $INSTANCE_NAME

Compute Engine 會傳播您的 SSH 金鑰,並建立您的使用者。詳情請參閱連線至執行個體一文。

停止執行個體

透過您的本機電腦 (而非執行個體) 執行以下指令:

gcloud compute instances stop $INSTANCE_NAME

stop 指令會執行乾淨關機作業。

啟動執行個體

執行個體剛建立完成後,Compute Engine 會啟動該執行個體。如要在執行個體停止時手動啟動執行個體,請執行以下指令:

gcloud compute instances start $INSTANCE_NAME

start 指令會啟動已停止的虛擬機器執行個體。

清除所用資源

如要避免系統向您的 Google Cloud 帳戶收取您在本頁所用資源的費用,請按照下列步驟操作。

如要刪除您建立的深度學習 VM 執行個體,請在指令列輸入以下指令:

gcloud compute instances delete $INSTANCE_NAME

delete 指令會刪除 Compute Engine 執行個體。

後續步驟