①用戶和AutoGLM的溝通為語(yǔ)音或文字形式,并實(shí)時(shí)顯示字幕; ②智譜同步發(fā)布“人味兒”更重的GLM-4-Voice端到端情感語(yǔ)音模型; ③當(dāng)下的AI助理依然存在很大的進(jìn)步空間。
《科創(chuàng)板日?qǐng)?bào)》10月28日訊(編輯 宋子喬) 臨近蘋果AI功能(Apple Intelligence)發(fā)布日,中國(guó)獨(dú)角獸企業(yè)智譜AI(以下簡(jiǎn)稱智譜)搶先上線了AI助理工具。
10月25日,智譜用三分鐘的視頻展示了AutoGLM帶來的便利:無需手動(dòng)操作,用戶對(duì)著手機(jī)說話(發(fā)出指令),便可讓其自動(dòng)打開手機(jī)上的各類App,進(jìn)行網(wǎng)購(gòu)、點(diǎn)外賣、訂高鐵票,甚至發(fā)微信、搶紅包、評(píng)論朋友圈、整理筆記并生成攻略、總結(jié)論文。從宣傳視頻中已經(jīng)有的功能看,智譜已展示淘寶、美團(tuán)、微信等App,這三個(gè)公司也是智譜的投資方。
用戶和AutoGLM的溝通為語(yǔ)音或文字形式,并實(shí)時(shí)顯示字幕。
手機(jī)成為AI助理,只需接收文字/語(yǔ)音指令,就可以模擬人類操作手機(jī),幫你解決日?,嵤?,這一幕是不是很像電影中的賈維斯來到現(xiàn)實(shí)?
同日(10月25日),智譜發(fā)布GLM-4-Voice端到端情感語(yǔ)音模型。
該模型的最大亮點(diǎn)在于,“人味兒”更重、交互體驗(yàn)更強(qiáng)。據(jù)介紹,GLM-4-Voice能夠根據(jù)用戶指令靈活調(diào)整語(yǔ)音的情感、語(yǔ)調(diào)、語(yǔ)速及方言等特征,且具有更低的延時(shí),支持實(shí)時(shí)打斷、多語(yǔ)言、多方言。作為端到端的語(yǔ)音模型,GLM-4-Voice避免了傳統(tǒng)的“語(yǔ)音轉(zhuǎn)文字再轉(zhuǎn)語(yǔ)音”級(jí)聯(lián)方案過程中帶來的信息損失和誤差積累,也擁有理論上更高的建模上限,即將上線視頻通話功能,旨在打造“能看又能說”的AI助理。
智譜表示,“GLM-4-Voice的出現(xiàn)是智譜在邁向AGI的道路上邁出的最新一步。”
目前,用戶可以通過安裝“智譜清言”插件體驗(yàn)AutoGLM,AutoGLM也在安卓系統(tǒng)上開放了內(nèi)測(cè)申請(qǐng),并與榮耀等手機(jī)廠商開展了深度合作。
資料顯示,智譜在2024年9月與榮耀共同成立AI大模型技術(shù)聯(lián)合實(shí)驗(yàn)室,與榮耀進(jìn)行深度合作。2024年10月23日榮耀Magic9.0發(fā)布會(huì)展示具備自動(dòng)駕駛功能的AI Agent YOYO。
開源證券稱,智譜AutoGLM大幅提高AI Agent的實(shí)用性,或推動(dòng)AI Agent用戶滲透率及商業(yè)化空間打開。
國(guó)泰君安表示,AutoGLM精準(zhǔn)理解用戶指令,自動(dòng)完成App操作,解放用戶雙手,有望加速手機(jī)廠商AI助理落地,具備自動(dòng)駕駛功能的AI助理可幫助用戶擺脫繁瑣的App操作,僅需語(yǔ)音指令即可滿足用戶需求,真正實(shí)現(xiàn)AI個(gè)人助理,有望驅(qū)動(dòng)AI手機(jī)換機(jī)潮,帶動(dòng)上游產(chǎn)業(yè)鏈需求上行。
不過AutoGLM依然存在很大的進(jìn)步空間。國(guó)泰君安便表示,手機(jī)端的“自動(dòng)駕駛”仍需明確指令,根據(jù)數(shù)字生命卡茲克發(fā)布的實(shí)測(cè)視頻,AutoGLM自動(dòng)駕駛需要用戶下達(dá)明確的指令信息,如預(yù)訂酒店,需要用戶給出時(shí)間、地點(diǎn)、預(yù)算及相應(yīng)房型。
另外,執(zhí)行如“幫我訂回家的機(jī)票”等更個(gè)性化指令,仍需與手機(jī)廠商進(jìn)行合作,獲取用戶個(gè)人信息使用權(quán)限方可實(shí)現(xiàn)。目前AutoGLM已可自動(dòng)執(zhí)行微信、淘寶、美團(tuán)、小紅書等App中用戶常用操作,更多個(gè)性化操作尚未實(shí)現(xiàn),并且未適配滴滴、京東、微信讀書等App,未來需要更多第三方廠商以及更全面的UI訓(xùn)練數(shù)據(jù)集支持。
終端有望迎AI助理時(shí)代 或帶來多層次產(chǎn)業(yè)機(jī)遇
AI助理(AI Agent)是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體,具備通過獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力,可拆解為大模型+規(guī)劃+記憶+工具使用四個(gè)組成部分。
應(yīng)用場(chǎng)景方面,AI助理適用于銷售、供應(yīng)鏈、客戶服務(wù)、財(cái)務(wù)、人力資源等。
對(duì)于AI產(chǎn)業(yè)而言,AI助理能夠?yàn)镃端提供個(gè)性化應(yīng)用、為B端提供降本增效方案;對(duì)于用戶而言,AI助理最核心的功能是AI自主操作手機(jī),輔助完成復(fù)雜推理任務(wù)。
業(yè)界正積極布局和探索AI助理,如阿里的MobileAgent、騰訊的App Agent、榮耀的MagicOS 9.0操作系統(tǒng)、蘋果的Apple Intelligence等,微軟、谷歌近期也相繼推出AI助理應(yīng)用。
10月22日凌晨,微軟宣布在Dynamics365中集成10個(gè)自主AI助理,可幫助企業(yè)自動(dòng)執(zhí)行客服、銷售、財(cái)務(wù)、倉(cāng)儲(chǔ)等業(yè)務(wù),這些AI助理支持OpenAI最新模型o1并具備自主學(xué)習(xí)能力,可以自動(dòng)執(zhí)行跨平臺(tái)的超復(fù)雜任務(wù);
10月24日,科大訊飛推出面向教育、醫(yī)療、司法、政府服務(wù)等領(lǐng)域的AI助手;
彩訊股份于10月11-13日的2024中國(guó)移動(dòng)全球合作伙伴大會(huì)上,正式推出一站式AI應(yīng)用開發(fā)平臺(tái)RichAIBox,可實(shí)現(xiàn)多個(gè)基座大模型統(tǒng)一接入、企業(yè)私域知識(shí)庫(kù)無縫銜接以及多場(chǎng)景智能體可視編排,助力企業(yè)快速構(gòu)建AI應(yīng)用。在應(yīng)用層面,公司也推出了3D數(shù)字人生成、圖生音樂彩靈、AI智舞、AI來電秘書等AIGC產(chǎn)品,覆蓋“5G新通話”各場(chǎng)景……
浙商證券表示,近期,國(guó)產(chǎn)多模態(tài)AI應(yīng)用的使用情況呈現(xiàn)爆發(fā)態(tài)勢(shì)——8月底Minimax推出文生視頻模型abab-video-1并應(yīng)用于海螺AI以來,使用生態(tài)呈現(xiàn)加速增長(zhǎng),據(jù)“AI產(chǎn)品榜”統(tǒng)計(jì),9月海螺AI網(wǎng)頁(yè)版訪問量環(huán)比增長(zhǎng)860%;而similarweb數(shù)據(jù)顯示,7月快手“可靈”視頻生成大模型上線以來,9月單月web端訪問量超1600萬(wàn)次。
該機(jī)構(gòu)認(rèn)為,AI助理應(yīng)用的爆發(fā)反映出國(guó)產(chǎn)多模態(tài)AI大模型能力的顯著提升,國(guó)產(chǎn)多模態(tài)AI應(yīng)用使用情況爆發(fā)式增長(zhǎng),為AI助理應(yīng)用奠定良好基礎(chǔ)。
華泰證券表示,AI助理是通往AGI的核心基礎(chǔ),AI助理落地帶來多個(gè)層次的產(chǎn)業(yè)機(jī)遇,其中,Agent+終端有望推動(dòng)人機(jī)交互變革,除了在終端銷售量?jī)r(jià)方面的變化外,可能對(duì)終端應(yīng)用的商業(yè)模式產(chǎn)生更加深遠(yuǎn)的影響。
德邦證券認(rèn)為,由于建立在大模型底層平臺(tái)上,AI助理在應(yīng)用場(chǎng)景實(shí)現(xiàn)規(guī)模化推廣以及高頻響應(yīng)后將催生巨大的推理算力需求,推理側(cè)或成為未來算力需求長(zhǎng)期藍(lán)海。