使用 gcloud CLI 建立深度學習 VM 執行個體
本頁面說明如何使用 Google Cloud CLI 建立深度學習 VM 映像檔執行個體。
事前準備
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
- 按照「安裝 Google Cloud CLI」一文中的指示下載並安裝 Google Cloud CLI。
- 按照初始化 Cloud SDK 一文中的指示初始化 SDK。
如要使用 Google Cloud CLI 進行本快速入門,您必須先安裝並初始化 Google Cloud CLI:
如要在 Cloud Shell 中使用 gcloud
進行本快速入門導覽課程,請先按照啟動 Cloud Shell 一文中的指示啟動 Cloud Shell。
建立新執行個體
以下操作說明會建立具有下列參數的深度學習 VM 執行個體:
- 在 CUDA 9.2 映像檔上使用 TensorFlow:
tf-latest-cu92
。 - 位在美國 West1-B 區域中:
us-west1-b
。 - 名稱為
my-new-instance
。 - 屬於執行個體類型
n1-standard-8
。 - 使用 NVIDIA Tesla V100 GPU:
type=nvidia-tesla-v100,count=8
。 - 具有 120 GB 的開機磁碟。
- 具有會在首次執行時安裝的 NVIDIA GPU 驅動程式:
install-nvidia-driver=True
。
在指令列中,輸入以下內容:
export IMAGE_FAMILY="tf-latest-cu92"
export ZONE="us-west1-b"
export INSTANCE_NAME="my-new-instance"
export INSTANCE_TYPE="n1-standard-8"
gcloud compute instances create $INSTANCE_NAME \
--zone=$ZONE \
--image-family=$IMAGE_FAMILY \
--image-project=deeplearning-platform-release \
--maintenance-policy=TERMINATE \
--accelerator="type=nvidia-tesla-v100,count=8" \
--machine-type=$INSTANCE_TYPE \
--boot-disk-size=120GB \
--metadata="install-nvidia-driver=True"
經過一段時間後,系統會建立 VM 執行個體並顯示其設定摘要。
您剛剛建立了第一個深度學習 VM 執行個體。如要驗證執行個體確實存在並查看其狀態,請使用 gcloud
list
指令 (如下所示) 列出所有執行個體:
gcloud compute instances list
這會顯示目前專案中所有區域的所有 Compute Engine 執行個體。
您也可以在Google Cloud 主控台的 Compute Engine VM 執行個體頁面中,查看及維護深度學習 VM 執行個體。
如要只查看這個執行個體的狀態,請使用以下指令:
gcloud compute instances describe $INSTANCE_NAME
存取新執行個體
深度學習 VM 執行個體在建立完成後會自動啟動。您可以使用以下指令,透過 SSH 存取該執行個體:
gcloud compute ssh $INSTANCE_NAME
Compute Engine 會傳播您的 SSH 金鑰,並建立您的使用者。詳情請參閱連線至執行個體一文。
停止執行個體
透過您的本機電腦 (而非執行個體) 執行以下指令:
gcloud compute instances stop $INSTANCE_NAME
stop
指令會執行乾淨關機作業。
啟動執行個體
執行個體剛建立完成後,Compute Engine 會啟動該執行個體。如要在執行個體停止時手動啟動執行個體,請執行以下指令:
gcloud compute instances start $INSTANCE_NAME
start
指令會啟動已停止的虛擬機器執行個體。
清除所用資源
如要避免系統向您的 Google Cloud 帳戶收取您在本頁所用資源的費用,請按照下列步驟操作。
如要刪除您建立的深度學習 VM 執行個體,請在指令列輸入以下指令:
gcloud compute instances delete $INSTANCE_NAME
delete
指令會刪除 Compute Engine 執行個體。
後續步驟
- 參閱「透過 CLI 建立深度學習 VM 執行個體」一文,深入瞭解這個流程。
- 進一步瞭解映像檔、映像檔系列和執行個體。