<meter id="i4i8e"></meter>

當(dāng)前位置：首頁(yè) > 外匯資訊 > 正文內(nèi)容

Jim Fan銳評(píng)：GPT-4o低延遲的奧秘在這里

激石外匯2024-05-14 11:49:28外匯資訊231

激石Pepperstone(http://qintiejiang.com/)報(bào)道：

14日凌晨，OpenAI召開了一個(gè)簡(jiǎn)短的發(fā)布會(huì)，發(fā)布了新的AI模型：GPT-4o，除了可以給普通用戶使用之外，還將開放相應(yīng)API給GPT的開發(fā)者，比原來(lái)的GPT 4-Turbo快2倍，價(jià)格還便宜50%，妥妥的“加量又減價(jià)”。

英偉達(dá)高級(jí)研究科學(xué)家Jim Fan對(duì)此發(fā)了篇長(zhǎng)推文，點(diǎn)評(píng)OpenAI的這款新模型：低延遲，支持文字、圖像和視頻輸入和輸出，而且還會(huì)假裝自己是有情感的人類...

原文如下：

我知道你的時(shí)間線上現(xiàn)在充斥著“瘋狂的，電影《Her》，你錯(cuò)過(guò)的10個(gè)功能，我們又回來(lái)了”這樣的文字。坐下來(lái)，像Mark在演示中那樣深呼吸，讓我們一步步思考：

從技術(shù)角度來(lái)看，OpenAI已經(jīng)找到了一種方法，可以直接將音頻映射到音頻作為第一類模態(tài)，并實(shí)時(shí)將視頻流傳輸?shù)絫ransformer大模型。這需要對(duì)標(biāo)記化和架構(gòu)進(jìn)行一些新的研究，但總體上是一個(gè)數(shù)據(jù)和系統(tǒng)優(yōu)化問(wèn)題。

高質(zhì)量的數(shù)據(jù)至少可以來(lái)自以下兩個(gè)來(lái)源：

首先是YouTube、播客、電視劇、電影等內(nèi)容包含的對(duì)話。

可以訓(xùn)練Whisper來(lái)識(shí)別對(duì)話中的發(fā)言者順序或分離重疊的講話以進(jìn)行自動(dòng)注釋。

其次是合成數(shù)據(jù)。使用強(qiáng)大的模型分3階段運(yùn)行：

語(yǔ)音1->文本1（自動(dòng)語(yǔ)音識(shí)別ASR）

文本1->文本2（大型語(yǔ)言模型LLM）

文本2->語(yǔ)音2（文本到語(yǔ)音TTS）。

期間大型語(yǔ)言模型LLM可以決定何時(shí)停止，也可以模擬如何從中斷中恢復(fù)。它可以輸出對(duì)話中暗含“想法”，以幫助生成更好的回復(fù)。

然后GPT-4o直接從語(yǔ)音1>語(yǔ)音2過(guò)程中進(jìn)行提取，可選的輔助損失函數(shù)基于3階段數(shù)據(jù)。提取后，所有操作都被被嵌入到模型中，而不需要發(fā)出中間文本。

在系統(tǒng)方面：如果每個(gè)視頻幀都解壓成RGB圖像，就能實(shí)現(xiàn)低延遲。OpenAI可能已經(jīng)開發(fā)了基于神經(jīng)網(wǎng)絡(luò)的流式視頻編解碼器，以token形式傳輸運(yùn)動(dòng)增量。通信協(xié)議和神經(jīng)網(wǎng)絡(luò)推理必須共同優(yōu)化。

例如，可以在終端設(shè)備上運(yùn)行一個(gè)小型且節(jié)能的神經(jīng)網(wǎng)絡(luò)，如果視頻有趣就傳輸更多token，否則傳輸較少。

我沒(méi)想到GPT-4o會(huì)離GPT-5更近，GPT-5是傳聞中的“Arrakis”模型，可以輸入和輸出多模態(tài)。實(shí)際上，它很可能是GPT-5的一個(gè)早期訓(xùn)練點(diǎn)，但還沒(méi)有完成訓(xùn)練。

GPT-4o的定位透露出OpenAI某種不安全感。在Google I/O之前，OpenAI寧愿超越我們對(duì)GPT-4.5的心理預(yù)期，也不愿因?yàn)檫_(dá)不到對(duì)GPT-5的極高期望而令人失望。這是一個(gè)聰明的舉措，可以爭(zhēng)取更多時(shí)間。

值得注意的是，GPT-4o更加活潑，甚至有點(diǎn)調(diào)皮。GPT-4o甚至嘗試（也許有點(diǎn)過(guò)于努力）聽起來(lái)像女性。OpenAI正在蠶食Character AI的市場(chǎng)份額，這兩家的產(chǎn)品高度重疊，并且OpenAI擁有龐大的分銷渠道。GPT-4o正嘗試向更具情感的AI轉(zhuǎn)變，OpenAI過(guò)去似乎積極抑制了這一點(diǎn)。

誰(shuí)先贏得蘋果，誰(shuí)就能大獲全勝。我看到與iOS的整合有三個(gè)層次：

1）放棄Siri。OpenAI為iOS提取一個(gè)較小級(jí)別的、純粹的設(shè)備上的GPT-4o，可選的付費(fèi)升級(jí)以使用云服務(wù)。

?2）將相機(jī)或屏幕流式傳輸?shù)侥Ｐ?，芯片?jí)支持神經(jīng)音頻/視頻編解碼器。

?3）與iOS系統(tǒng)級(jí)操作API和智能家居API整合。沒(méi)有人使用Siri快捷方式，但現(xiàn)在是時(shí)候復(fù)活了。這可以立即成為擁有10億用戶的AI代理產(chǎn)品。智能手機(jī)的全自動(dòng)駕駛（FSD）與特斯拉規(guī)模的數(shù)據(jù)飛輪。?????????

掃描二維碼推送至手機(jī)訪問(wèn)。

版權(quán)聲明：本文由激石Pepperstone發(fā)布，如需轉(zhuǎn)載請(qǐng)注明出處。

本文鏈接：http://qintiejiang.com/news/3045.html

標(biāo)簽: GPT-4o

分享給朋友：

返回列表

上一篇：“大行放貸、小行買債”--銀行“資產(chǎn)荒”由來(lái)

下一篇：AH股盤初迅速?zèng)_高，恒科指一度漲超2%，游戲股普漲

“Jim Fan銳評(píng)：GPT-4o低延遲的奧秘在這里” 的相關(guān)文章

鮑威爾“最堅(jiān)定承諾”：對(duì)抗通脹是“無(wú)條件的”

激石Pepperstone(http://qintiejiang.com/)報(bào)道：6月23日（周四），美聯(lián)儲(chǔ)首席鮑威爾對(duì)國(guó)會(huì)表示，美聯(lián)儲(chǔ)抗擊通脹的承諾是“無(wú)條件的”，這是他們?cè)诿鎸?duì)40年來(lái)最嚴(yán)重的通脹問(wèn)題時(shí)，所給出的迄今為止最堅(jiān)定的承諾。鮑威爾對(duì)美國(guó)眾議院金融服務(wù)委員會(huì)說(shuō)：“我們真的需要恢復(fù)價(jià)格...

電池漲、油價(jià)漲！美國(guó)電動(dòng)車全線漲價(jià)

激石Pepperstone(http://qintiejiang.com/)報(bào)道：在過(guò)去幾個(gè)月里，特斯拉、福特、通用汽車、Rivian和Lucid紛紛提高了其電動(dòng)車的價(jià)格。 6月16日，特斯拉大幅提高了其所有產(chǎn)品線的電動(dòng)汽車的價(jià)格，其中一些車型的價(jià)格漲幅高達(dá)6000美元。特斯拉最暢銷的Model Y...

又是這個(gè)國(guó)家！通脹高達(dá)191%，央行“暴力”加息到200%，還要發(fā)金幣

激石Pepperstone(http://qintiejiang.com/)報(bào)道：據(jù)央視正點(diǎn)財(cái)經(jīng)報(bào)道，當(dāng)?shù)貢r(shí)間周一（6月28日），津巴布韋儲(chǔ)備銀行（央行）宣布將本國(guó)基準(zhǔn)利率提升至創(chuàng)紀(jì)錄的200%，同時(shí)津政府正式將美元重新引入作為法定貨幣，以平抑三位數(shù)的通脹以及穩(wěn)定匯率。圖片來(lái)源：央視正點(diǎn)財(cái)經(jīng)欄...

最悲觀的萬(wàn)科也“翻多”了，房地產(chǎn)龍頭剛剛集體大漲

激石Pepperstone(http://qintiejiang.com/)報(bào)道：6月29日，房地產(chǎn)板塊早盤逆勢(shì)走強(qiáng)，信達(dá)地產(chǎn)、濱江集團(tuán)等漲停，金地集團(tuán)漲8%，萬(wàn)科A漲一度漲超7%。消息面上，萬(wàn)科董事會(huì)主席郁亮在28日的股東大會(huì)上表示，從短期來(lái)看，地產(chǎn)市場(chǎng)已經(jīng)觸底，但是恢復(fù)是個(gè)緩慢溫和的過(guò)程。...

特斯拉二季度或因比特幣損失4.4億美元，相當(dāng)于年度利潤(rùn)9%

激石Pepperstone(http://qintiejiang.com/)報(bào)道：特斯拉可能會(huì)在其即將發(fā)布的季度報(bào)告中報(bào)告約4.4億美元的比特幣減值損失。據(jù)英國(guó)《每日電訊報(bào)》7月3日?qǐng)?bào)道，在比特幣價(jià)值大幅下跌后，特斯拉面臨著其持有的比特幣4.4億美元的減記，這相當(dāng)于特斯拉去年利潤(rùn)的9%。特斯拉于...

輪到vivo了

激石Pepperstone(http://qintiejiang.com/)報(bào)道：據(jù)印度新德里電視臺(tái)5日?qǐng)?bào)道，印度執(zhí)法局當(dāng)天在全國(guó)44個(gè)地點(diǎn)突擊搜查中國(guó)手機(jī)廠商vivo及其他相關(guān)公司，聲稱要調(diào)查其是否從事所謂洗錢活動(dòng)。5日晚些時(shí)候，vivo就此事對(duì)《環(huán)球時(shí)報(bào)》回應(yīng)稱：“vivo正...

Jim Fan銳評(píng)：GPT-4o低延遲的奧秘在這里

“Jim Fan銳評(píng)：GPT-4o低延遲的奧秘在這里” 的相關(guān)文章

鮑威爾“最堅(jiān)定承諾”：對(duì)抗通脹是“無(wú)條件的”

電池漲、油價(jià)漲！美國(guó)電動(dòng)車全線漲價(jià)

又是這個(gè)國(guó)家！通脹高達(dá)191%，央行“暴力”加息到200%，還要發(fā)金幣

最悲觀的萬(wàn)科也“翻多”了，房地產(chǎn)龍頭剛剛集體大漲

特斯拉二季度或因比特幣損失4.4億美元，相當(dāng)于年度利潤(rùn)9%

輪到vivo了

Copyright ? 2017-2022 激石Pepperstone

電池漲、油價(jià)漲！美國(guó)電動(dòng)車全線漲價(jià)

又是這個(gè)國(guó)家！通脹高達(dá)191%，央行“暴力”加息到200%，還要發(fā)金幣

最悲觀的萬(wàn)科也“翻多”了，房地產(chǎn)龍頭剛剛集體大漲