表格型資料總覽

Vertex AI 提供簡單的程序和介面,讓您使用表格資料執行機器學習。您可以針對表格資料問題建立下列模型類型:

  • 二元分類模型可預測二元結果 (兩個類別之一)。這個模型類型可用於是非題,舉例來說,您可能想建構二元分類模型,預測顧客是否會購買訂閱方案。一般來說,二元分類問題需要的資料量少於其他模型類型。
  • 多元分類模型可從三個以上的分離類別預測一個類別。使用此模型類型進行分類。舉例來說,零售商可能想建構多元分類模型,將顧客區分為不同人物角色。
  • 「迴歸」模型可預測連續值。舉例來說,零售商可能會想建構迴歸模型,預測顧客下個月的消費金額。
  • 預測模型可預測一系列值。舉例來說,零售商可能想預測未來 3 個月的每日產品需求,以便提前適當備貨。

如要瞭解如何使用表格資料進行機器學習,請參閱表格資料簡介。如要進一步瞭解 Vertex AI 解決方案,請參閱「Vertex AI 解決方案:分類和迴歸」和「Vertex AI 解決方案:預測」。

公平性注意事項

Google 致力於遵循負責任的 AI 做法,並持續進步。為此,我們的機器學習產品 (包括 AutoML) 都是以核心原則為基礎設計,例如公平性以人為本的機器學習。如要進一步瞭解建構自有 ML 系統時,如何採取最佳做法來減輕偏誤,請參閱「包容性機器學習指南 - AutoML」。

適用於分類和迴歸的 Vertex AI 解決方案

Vertex AI 提供下列分類和迴歸解決方案:

端對端 AutoML 的表格工作流程

端對端 AutoML 的表格工作流程是完整的 AutoML 管道,適用於分類和迴歸工作。這項 API 與 AutoML API 類似,但可讓您選擇要控制及自動執行的項目。您不必控管整個管道,而是控管管道中的每個步驟。這些管道控制項包括:

  • 資料分割
  • 特徵工程
  • 架構搜尋
  • 模型訓練
  • 模型組合
  • 模型蒸餾

優點

  • 支援大小達數 TB 且最多有 1,000 欄的大型資料集
  • 您可以限制架構類型搜尋空間或略過架構搜尋,提升穩定性並縮短訓練時間
  • 手動選取用於訓練和架構搜尋的硬體,提升訓練速度
  • 您可以透過蒸餾或變更模型組合大小,縮減模型大小並改善延遲時間
  • 您可以在功能強大的管道圖表介面中檢查每個 AutoML 元件,查看轉換後的資料表、評估的模型架構,以及更多詳細資料。
  • 每個 AutoML 元件都具備更高的彈性和透明度,例如可自訂參數和硬體、查看程序狀態和記錄等。

如要進一步瞭解 Tabular Workflows,請參閱 Vertex AI 上的 Tabular Workflows。 如要進一步瞭解端對端 AutoML 的表格式工作流程,請參閱「端對端 AutoML 的表格式工作流程」。

TabNet 適用的 Tabular Workflow

TabNet 適用的 Tabular Workflow 是一項 pipeline,可用於訓練分類或迴歸模型。TabNet 會運用順序注意力,選擇每個決策步驟要以哪些特徵進行推論。這有助於解讀結果,並提高學習效率,因為學習容量會用於最顯著的特徵。

優點

  • 根據資料集大小、推論類型和訓練預算,自動選取適當的超參數搜尋空間。
  • 與 Vertex AI 整合。訓練好的模型是 Vertex AI 模型。您可以立即執行批次推論,或部署模型以進行線上推論。
  • 提供模型固有的可解釋性。您可以深入瞭解 TabNet 用來做出決策的特徵。
  • 支援 GPU 訓練。

如要進一步瞭解 Tabular Workflows,請參閱 Vertex AI 上的 Tabular Workflows。 如要進一步瞭解 TabNet 適用的 Tabular Workflow,請參閱「TabNet 適用的 Tabular Workflow」。

廣度和深度學習適用的 Tabular Workflow

廣度和深度學習適用的 Tabular Workflow 是一種 pipeline,可用於訓練分類或迴歸模型。廣度和深度會一同訓練廣度線性模型和深層類神經網路,兼具記憶和一般化的能力。在某些線上實驗中,結果顯示與僅限廣泛和僅限深入模型相比,Wide & Deep 可大幅增加 Google 商店應用程式的獲客數。

優點

  • 與 Vertex AI 整合。訓練好的模型是 Vertex AI 模型。您可以立即執行批次推論,或部署模型以進行線上推論。

如要進一步瞭解 Tabular Workflows,請參閱 Vertex AI 上的 Tabular Workflows。 如要進一步瞭解廣度和深度學習適用的 Tabular Workflow,請參閱廣度和深度學習適用的 Tabular Workflow

使用 AutoML 進行分類和迴歸

Vertex AI 提供整合式全代管管道,可執行端對端分類或迴歸工作。Vertex AI 會搜尋最佳超參數組合,使用多組超參數訓練多個模型,然後從頂尖模型組合建立單一最終模型。Vertex AI 會將類神經網路和提升樹狀結構視為模型類型。

優點

  • 簡單易用:Vertex AI 會為您選擇模型類型、模型參數和硬體。

詳情請參閱「分類和迴歸總覽」。

Vertex AI 預測解決方案

Vertex AI 提供下列預測解決方案:

表格預測工作流程

表格預測工作流程是預測工作的完整管道。這項 API 與 AutoML API 類似,但可讓您選擇要控制及自動執行的項目。您不必控管整個管道,而是控管管道中的每個步驟。這些管道控制項包括:

  • 資料分割
  • 特徵工程
  • 架構搜尋
  • 模型訓練
  • 模型組合

優點

  • 支援大型資料集,大小上限為 1 TB,最多可有 200 個資料欄。
  • 您可以限制架構類型的搜尋空間或略過架構搜尋,提升穩定性並縮短訓練時間
  • 可手動選取用於訓練和架構搜尋的硬體,提升訓練速度
  • 您可以變更集合大小,縮減模型大小並縮短延遲時間
  • 您可以在功能強大的管道圖介面中檢查每個元件,查看轉換後的資料表、評估的模型架構和許多其他詳細資料。
  • 每個元件都能獲得更大的彈性和透明度,例如自訂參數、硬體、查看程序狀態、記錄等。

如要進一步瞭解 Tabular Workflows,請參閱 Vertex AI 上的 Tabular Workflows。 如要進一步瞭解表格預測工作流程,請參閱「表格預測工作流程」。

使用 AutoML 進行預測

Vertex AI 提供整合式全代管管道,可執行端對端預測工作。Vertex AI 會搜尋最佳超參數組合,使用多組超參數訓練多個模型,然後從頂尖模型組合建立單一最終模型。您可以選擇時間序列密集編碼器 (TiDE)時間融合轉換器 (TFT)AutoML (L2L) 和 Seq2Seq+ 做為模型訓練方法。Vertex AI 只會將類神經網路視為模型類型。

優點

  • 簡單易用:Vertex AI 會為您選擇模型參數和硬體。

詳情請參閱「預測總覽」。

使用 BigQuery ML ARIMA_PLUS 進行預測

BigQuery ML ARIMA_PLUS 是單變數預測模型。做為統計模型,訓練速度比以類神經網路為基礎的模型更快。如果您需要快速反覆訓練模型,或是需要便宜的基準來評估其他模型,建議訓練 BigQuery ML ARIMA_PLUS 模型。

Prophet 類似,BigQuery ML ARIMA_PLUS 會嘗試將每個時間序列分解為趨勢、季節和節慶,並使用這些模型推論結果的匯總資料產生預測。不過,兩者有許多差異,其中之一是 BQML ARIMA+ 會使用 ARIMA 建立趨勢元件模型,而 Prophet 則會嘗試使用分段邏輯或線性模型來擬合曲線。

Google Cloud 提供訓練 BigQuery ML ARIMA_PLUS 模型的管道,以及從 BigQuery ML ARIMA_PLUS 模型取得批次推論結果的管道。這兩個管道都是 Google Cloud Pipeline Components (GCPC) 的 Vertex AI Pipelines 執行個體。

優點

  • 簡單易用:BigQuery 會為您選擇模型參數和硬體。
  • 快速:模型訓練可提供低成本的基準,用來比較其他模型。

詳情請參閱「使用 ARIMA+ 進行預測」。

使用 Prophet 進行預測

Prophet 是 Meta 維護的預測模型。如要瞭解演算法詳情,請參閱 Prophet 論文,如要進一步瞭解程式庫,請參閱說明文件

BigQuery ML ARIMA_PLUS 類似,Prophet 會嘗試將每個時間序列分解為趨勢、季節和節慶,並使用這些模型推論的匯總結果產生預測。不過,BQML ARIMA+ 是使用 ARIMA 建立趨勢元件模型,而 Prophet 則嘗試使用分段式羅吉斯迴歸或線性模型來擬合曲線,這是兩者之間的重要差異。

Google Cloud 提供訓練 Prophet 模型的管道,以及從 Prophet 模型取得批次推論結果的管道。這兩個管道都是 Google Cloud Pipeline Components (GCPC) 的 Vertex AI Pipelines 執行個體。

將 Prophet 與 Vertex AI 整合後,您就能執行下列操作:

雖然 Prophet 是多元模型,但 Vertex AI 僅支援單元版本。

優點

  • 彈性:您可以選取用於訓練的硬體,提升訓練速度

詳情請參閱「使用 Prophet 進行預測」。

後續步驟