特徵預先處理總覽

特徵預先處理是機器學習生命週期中最重要的步驟之一。這項作業包括建立特徵和清理訓練資料。建立特徵也稱為「特徵工程」

BigQuery ML 提供下列特徵預先處理技術:

  • 自動預先處理。BigQuery ML 會在訓練期間自動執行預先處理作業。詳情請參閱「自動特徵預先處理」。

  • 手動預先處理。您可以在 CREATE MODEL 陳述式中使用 TRANSFORM 子句,藉由使用手動預處理函式定義自訂預處理作業。您也可以在 TRANSFORM 子句外使用這些函式,在建立模型前處理訓練資料。

取得地圖項目資訊

您可以使用 ML.FEATURE_INFO 函式擷取所有輸入特徵欄的統計資料。

只要使用 CREATE MODEL 陳述式和推論函式中的預設設定,即使您沒有太多機器學習知識,也能建立及使用 BigQuery ML 模型。不過,如果您具備機器學習開發生命週期的基本知識,例如特徵工程和模型訓練,就能將資料和模型最佳化,進而獲得更優異的結果。建議您參考下列資源,熟悉機器學習技術和程序:

後續步驟

瞭解 BigQuery ML 中的特徵服務