將語音轉為文字

本頁面說明如何使用 Vertex AI Studio 將語音轉換為文字。

如要瞭解如何將文字轉換為語音,請參閱「將文字轉換為語音」。

將語音轉為文字

如要將語音轉換成文字,請按照下列步驟操作:

  1. 在 Google Cloud 控制台的 Vertex AI 專區中,前往「Vertex AI Studio」頁面。

    前往 Vertex AI Studio

  2. 按一下「產生語音」

  3. 選取「語音轉文字」分頁標籤。

  4. 在「語音」中,按一下「瀏覽」,選取要轉換成文字的音訊檔案。

  5. 在「語言」選取器方塊中,選取音訊檔案中的語音語言。

  6. 按一下「提交」

    轉換後的文字會顯示在「文字」中。

限制

  • 音訊檔案的長度不得超過 60 秒或 10 MB (以較小者為準)。
  • 系統會使用 Chirp 模型轉錄檔案。
  • 僅支援 16 位元線性 PCM WAV 檔案。

您可以直接使用 Speech-to-Text 使用者介面來克服這些限制。

後續步驟

  • 如要瞭解更多模型、進階功能,以及轉錄長達 8 小時的檔案,請參閱「Speech-to-Text」。