音訊資料為二進位資料。您可以直接從 gRPC 回應讀取二進位資料,但在回應 REST 要求時,系統會使用 JSON。由於 JSON 是一種文字格式,不直接支援二進位資料,因此 Text-to-Speech 會傳回以 Base64 編碼的回應字串。您必須先將回應中的 base64 編碼文字資料轉換成二進位資料,然後才能在裝置上播放。
Text-to-Speech 的 JSON 回應會在 audioContent
欄位中加入 base64 編碼的音訊內容。例如:
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
若要將 base64 解碼成音訊檔案:
Linux
僅將 base-64 編碼內容複製到文字檔。
使用
-d
標記,透過 base64 指令列工具解碼來源文字檔:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
僅將 base-64 編碼內容複製到文字檔。
使用 base64 指令列工具解碼來源文字檔:
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
僅將 base-64 編碼內容複製到文字檔。
使用
certutil
指令解碼來源文字檔。
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE