概述
Audiobox 是 Meta 開發的一款生成式人工智慧模型,它突破了音訊合成的界限。與簡單的文字轉語音工具不同,Audiobox 允許用戶透過將文字提示與音訊參考相結合來創建複雜的音訊環境和細緻的語音,從而提供了一種高度靈活的方式來製作音景和配音。
主要能力
- 文字轉音訊生成: 只需用簡單的英語描述場景,即可製作音效或環境噪音。
- 語音克隆與控制: 產生模仿特定聲音特徵或根據使用者輸入調整音調和情緒的語音。
- 音訊到音訊的編輯: 透過提供基於文字的指令來修改現有音訊片段,以更改樣式或環境。
- 多模態輸入: 將一段簡短的音訊樣本與文字提示結合起來,引導人工智慧找到特定的聲音特徵。
最適合
- 內容創作者: 快速產生免版稅的影片或Podcast音效。
- 遊戲開發者: 製作環境背景音效和角色配音原型。
- 人工智慧研究人員: 探索自然語言處理與聲學合成的交叉領域。
限制和定價
Audiobox 主要是研究示範工具。雖然目前可以免費使用,但其可用性可能會受到候補名單或地區限制的影響。使用者應注意,作為研究工具,其輸出一致性可能存在差異,商業用途的授權應透過 Meta 的官方條款進行確認。
免責聲明:產品功能、供貨情況和價格如有變更,恕不另行通知。請造訪 Audiobox 官方網站查看最新資訊。
資訊可能不完整或過時;請在官方網站上確認詳細資訊。
結尾