ChatGPT高級語音助手正式上線!OpenAI:50多種語言、9種聲線可選
原創(chuàng)
2024-09-25 08:46 星期三
財(cái)聯(lián)社 黃君芝
①OpenAI終于要面向其所有付費(fèi)用戶開放ChatGPT的類人高級人工智能(AI)語音助手功能——“高級語音模式”(AVM);
②所有付費(fèi)訂閱ChatGPT Plus和Team計(jì)劃的用戶,都將可以使用新的AVM功能,不過該模式將在未來幾天逐步推出。

財(cái)聯(lián)社9月25日訊(編輯 黃君芝)在首次向公眾展示的四個(gè)月后,OpenAI終于要面向其所有付費(fèi)用戶開放ChatGPT的類人高級人工智能(AI)語音助手功能——“高級語音模式”(Advanced Voice Mode,以下簡稱AVM)。

OpenAI周二(24日)宣布,所有付費(fèi)訂閱ChatGPT Plus和Team計(jì)劃的用戶,都將可以使用新的AVM功能,不過該模式將在未來幾天逐步推出。它將首先在美國市場上線。下周,該功能將向OpenAI Edu 和Enterprise 計(jì)劃的訂閱者開放。

據(jù)悉,AVM提高了部分外語的對話速度、流暢度并改進(jìn)口音。

image

此外,AVM還新增了兩大功能:為語音助手存儲(chǔ)“自定義指令”,以及記住用戶希望語音助手表現(xiàn)何種行為的“記憶”的功能(這類似于今年4月OpenAI為ChatGPT文本版本推出的記憶功能)。

也就是說,ChatGPT用戶可以利用自定義指令和“記憶”來確保語音模式是個(gè)性化的,AVM會(huì)根據(jù)他們對所有對話的偏好做出響應(yīng)。

語音方面,OpenAI推出了五種不同風(fēng)格的新聲音:Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版本的四種聲音Breeze、Juniper、Cove和Ember,可選聲音達(dá)到九種,撤走了被指山寨“寡姐”(女演員斯嘉麗·約翰遜)的聲音Sky。

這意味著,ChatGPT的Plus版?zhèn)€人用戶和小型企業(yè)團(tuán)隊(duì)用戶(Teams)可以通過“說話”的方式,而不是輸入提示來使用聊天機(jī)器人。當(dāng)用戶在應(yīng)用程序上進(jìn)入語音模式時(shí),他們會(huì)通過一個(gè)彈出窗口知道他們已經(jīng)進(jìn)入了高級語音助手。

最后值得一提的是,AVM可以用超過50種語言說“對不起,我遲到了”。

根據(jù)OpenAI在X上發(fā)布的一段視頻,用戶要求語音助手表達(dá),由于讓奶奶久等了,向奶奶致歉。AVM先用英語流暢地總結(jié)了一遍,并在用戶表示“奶奶只會(huì)說普通話”后,又用標(biāo)準(zhǔn)的中文普通話表達(dá)了一遍。

image

不過據(jù)悉,這些更新只適用于OpenAI的AI模型GPT-4o,不適用于最近發(fā)布的預(yù)覽模型o1。

今年5月,OpenAI首次展示了這款語音產(chǎn)品,并展示了它如何快速響應(yīng)用戶發(fā)出的書面和視覺提示。但在6月,以解決潛在安全問題為由,推遲發(fā)布。到了7月份,該功能也只面向有限數(shù)量的ChatGPT Plus用戶開放。

不過,新的語音模式缺少5月OpenAI展示過的不少功能,比如計(jì)算機(jī)視覺功能。該功能可讓GPT僅通過使用智能手機(jī)的攝像頭就對用戶的舞蹈動(dòng)作提供語音反饋。

收藏
59.49W
我要評論
歡迎您發(fā)表有價(jià)值的評論,發(fā)布廣告和不和諧的評論都將會(huì)被刪除,您的賬號(hào)將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
9.72W 人關(guān)注
4.22W 人關(guān)注
8783 人關(guān)注