【OpenAI公布語音AI工具15秒的說話聲音樣本就能複製人聲 不過認為這項語音複製工具風險太大不適合全面發布】

綜合外媒報導,美國人工智慧開發公司OpenAI於3月29日公布了一項名為「Voice Engine」的語音AI工具,其能夠根據僅僅15秒的語音樣本複製出該人的聲音。然而,OpenAI也認為這項語音複製工具存在著巨大的風險,因此不適合全面推出。

該公司於2022年首次開發了「Voice Engine」,最初版本被用於ChatGPT內建的文字轉語音功能。這項技術的生成結果不受語言限制,例如,若使用英文的語音樣本,則可生成西班牙語、法語等其他語言的聲音。然而,考慮到濫用的風險,目前僅向合作夥伴開放使用,尚未對外公開。OpenAI推遲推出「Voice Engine」,是為了在至關重要的全球大選年,盡量減少假消息的可能性。

OpenAI在一篇貼文中表示,目前「Voice Engine」生成的結果都帶有浮水印,以便追蹤生成的音檔的來源。與合作夥伴的使用條款也要求,必須獲得原始說話者的明確知情同意,並且不允許開發人員讓個人用戶自行創建聲音檔案。目前選擇預覽而非廣泛發布這項技術,是為了增強社會面對「更具說服力的生成模型」的能力。他們呼籲逐步淘汰語音認證作為登入銀行帳戶或其他敏感資訊的安全措施,制定在人工智能領域使用個人聲音的保護政策,並推廣對AI能力與限制的公眾教育,包括欺騙性內容。OpenAI指出:「我們希望針對負責任地使用合成聲音,以及社會如何適應這些新功能,展開一場對話。」

Previous article【美國有一間科技公司推出用機器人 幫客戶寫出手寫字體一般優美的信件】
Next article【印度東北部阿薩姆邦颳起強風降下暴雨當地機場天花板部分倒塌 造成大量雨水在室內瞬間傾瀉而下】