當(dāng)前位置：首頁(yè) > 外匯資訊 > 正文內(nèi)容

OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！

激石外匯2024-03-30 11:59:25外匯資訊235

激石Pepperstone(http://qintiejiang.com/)報(bào)道：

3月30日凌晨，OpenAI在官網(wǎng)首次展示了全新自定義音頻模型“Voice Engine”。

用戶只需要提供15秒左右的參考聲音，通過(guò)Voice Engine就能生成幾乎和原音一模一樣的全新音頻，在清晰度、語(yǔ)音連貫、音色、自然度等方面比市面上多數(shù)產(chǎn)品都強(qiáng)很多。

除了能合成音頻之外，OpenAI還展示了Voice Engine很多其他際商業(yè)用途，例如，一位失去聲音表達(dá)能力的女孩，在Voice Engine幫助下能像以前一樣正常發(fā)音說(shuō)話。

Voice Engine功能展示

OpenAI并非展示了一些簡(jiǎn)單的demo，而是一些實(shí)際場(chǎng)景化用例，這也就是說(shuō)Voice Engine的技術(shù)已經(jīng)非常成熟。

Age of Learning 是一家兒童教育公司，他們一直在使用Voice Engine生成各種有聲讀物。同時(shí)還通過(guò)與GPT-4的相結(jié)合使用，創(chuàng)建實(shí)時(shí)、個(gè)性化的回答與學(xué)生互動(dòng)。

例如，使用一段15秒的參考音頻。

就可以生成幾乎一模一樣的語(yǔ)音。

除了語(yǔ)音合成之外，Voice Engine還能提供視頻翻譯功能，可以將一種視頻語(yǔ)音無(wú)差別的翻譯成多國(guó)語(yǔ)言。

HeyGen是一家AI視頻合成平臺(tái)，主要幫助企業(yè)開發(fā)商品展示的“數(shù)字人”。他們通過(guò)使用Voice Engine進(jìn)行視頻翻譯，擴(kuò)展至多國(guó)語(yǔ)言來(lái)擴(kuò)大全球覆蓋受眾。

輸入一段原參考語(yǔ)音

就能將其轉(zhuǎn)化成中文語(yǔ)音

或者日文語(yǔ)音

幫助聲音受損的人恢復(fù)聲音：諾曼-普林斯生命科學(xué)研究所正在測(cè)試一項(xiàng)實(shí)驗(yàn)，正通過(guò)Voice Engine幫助那些因腫瘤或神經(jīng)系統(tǒng)病因，導(dǎo)致語(yǔ)言障礙的患者恢復(fù)聲音。

目前，他們已經(jīng)幫助一位因血管性腦腫瘤，而失去流利語(yǔ)言表達(dá)能力的年輕女患者恢復(fù)了聲音。

下面這段聲音是女患者的，她已經(jīng)無(wú)法清楚表達(dá)自己說(shuō)的話。

通過(guò)提供她之前正常的語(yǔ)音，用Voice Engine進(jìn)行轉(zhuǎn)譯。

現(xiàn)在這位女患者可以正常與其他人交流了。

OpenAI表示，其實(shí)他們?cè)?022年底便開發(fā)了Voice Engine，并將其用于支持文本到語(yǔ)音 API 中的預(yù)設(shè)語(yǔ)音以及 ChatGPT 的語(yǔ)音和朗讀功能。

但出于安全考慮一直沒(méi)有全面公測(cè)，目前也只是小范圍測(cè)試。因?yàn)橄啾任谋?、視頻，音頻的造假能力太強(qiáng)了幾乎無(wú)法分辨出來(lái)。

此外，OpenAI首席技術(shù)官M(fèi)ira Murati在前不久接受的采訪時(shí)表示，未來(lái)Sora生成的視頻會(huì)帶聲音的，很可能為其提供聲音的就是Voice Engine。?????????

掃描二維碼推送至手機(jī)訪問(wèn)。

版權(quán)聲明：本文由激石Pepperstone發(fā)布，如需轉(zhuǎn)載請(qǐng)注明出處。

本文鏈接：http://qintiejiang.com/news/2860.html

標(biāo)簽: OpenAI 音頻模型Voice Engine

分享給朋友：

返回列表

上一篇：蘋果新版iPad終于要來(lái)了！5月初發(fā)布，OLED屏幕，12.9英寸首現(xiàn)

下一篇：全球股市的一季度：五年最佳開局，AI火熱、日本搶眼

“OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！ ” 的相關(guān)文章

正是年中挖票時(shí)，睿遠(yuǎn)“雙雄”再次“出山”，一家電氣設(shè)備公司進(jìn)入“法眼”

激石Pepperstone(http://qintiejiang.com/)報(bào)道：歷來(lái)，“年中時(shí)分”總是機(jī)構(gòu)積極調(diào)研并為下半年布局籌劃的時(shí)候，這時(shí)基金經(jīng)理的“步履蹤跡”也格外緊密。今年年中恰逢市場(chǎng)走強(qiáng)，諸多知名權(quán)益投資機(jī)構(gòu)和明星基金經(jīng)理先后下場(chǎng)調(diào)研。其中，睿遠(yuǎn)基金、東方紅，以及近年私募的后起新銳...

激石Pepperstone：昨天“嚇崩”美股的報(bào)告，說(shuō)了什么？

OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！

“OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！ ” 的相關(guān)文章

正是年中挖票時(shí)，睿遠(yuǎn)“雙雄”再次“出山”，一家電氣設(shè)備公司進(jìn)入“法眼”

激石Pepperstone：昨天“嚇崩”美股的報(bào)告，說(shuō)了什么？

數(shù)字幣崩盤，顯卡遭殃

一個(gè)時(shí)代的終結(jié)：Naspers、軟銀各自從騰訊、阿里抽身

住房市場(chǎng)降溫！美國(guó)房租高增長(zhǎng)戛然而止

槍殺安倍嫌犯：行動(dòng)已謀劃數(shù)月本打算用自制炸彈殺人

Copyright ? 2017-2022 激石Pepperstone

OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！

“OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！ ” 的相關(guān)文章

正是年中挖票時(shí)，睿遠(yuǎn)“雙雄”再次“出山”，一家電氣設(shè)備公司進(jìn)入“法眼”

激石Pepperstone：昨天“嚇崩”美股的報(bào)告，說(shuō)了什么？

數(shù)字幣崩盤，顯卡遭殃

一個(gè)時(shí)代的終結(jié)：Naspers、軟銀各自從騰訊、阿里抽身

住房市場(chǎng)降溫！美國(guó)房租高增長(zhǎng)戛然而止

槍殺安倍嫌犯：行動(dòng)已謀劃數(shù)月 本打算用自制炸彈殺人

Copyright ? 2017-2022 激石Pepperstone

OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！

“OpenAI首次展示音頻模型Voice Engine，15秒即可復(fù)制原音，生成的聲音太逼真了！ ” 的相關(guān)文章

正是年中挖票時(shí)，睿遠(yuǎn)“雙雄”再次“出山”，一家電氣設(shè)備公司進(jìn)入“法眼”

激石Pepperstone：昨天“嚇崩”美股的報(bào)告，說(shuō)了什么？

一個(gè)時(shí)代的終結(jié)：Naspers、軟銀各自從騰訊、阿里抽身

住房市場(chǎng)降溫！美國(guó)房租高增長(zhǎng)戛然而止

槍殺安倍嫌犯：行動(dòng)已謀劃數(shù)月本打算用自制炸彈殺人