①在這一輪更為看中落地應(yīng)用實(shí)現(xiàn)造血的這一輪AI大模型創(chuàng)業(yè)浪潮里,巖芯數(shù)智的市場(chǎng)策略是,快速推進(jìn)Yan模型在更廣泛的終端落地應(yīng)用,設(shè)備才是真正毛細(xì)血管,能觸達(dá)到千千萬萬的用戶; ②Yan模型目前已經(jīng)實(shí)現(xiàn)了在機(jī)器人、PC、手機(jī)、無人機(jī)等各類終端設(shè)備上的落地。
發(fā)展“新質(zhì)生產(chǎn)力”正成為我國(guó)推動(dòng)高質(zhì)量發(fā)展的內(nèi)在要求和重要著力點(diǎn)。2月29日,中共中央政治局會(huì)議指出,今年經(jīng)濟(jì)工作要堅(jiān)持穩(wěn)中求進(jìn)、以進(jìn)促穩(wěn)、先立后破。要大力推進(jìn)現(xiàn)代化產(chǎn)業(yè)體系建設(shè),加快發(fā)展新質(zhì)生產(chǎn)力。
上海張江,作為中國(guó)科技創(chuàng)新的重要引擎,以其獨(dú)特的創(chuàng)新生態(tài)和前沿技術(shù),不斷孕育出具有劃時(shí)代意義的新質(zhì)生產(chǎn)力。
為調(diào)研新質(zhì)生產(chǎn)力的發(fā)展成果,張江科學(xué)城、財(cái)聯(lián)社、《科創(chuàng)板日?qǐng)?bào)》聯(lián)合推出“新質(zhì)生產(chǎn)力看張江”。我們深入一線采訪:張江的企業(yè)如何創(chuàng)業(yè)創(chuàng)新,活力四射;張江的產(chǎn)業(yè)如何向“新”而行,提“質(zhì)”而上。
本期專訪企業(yè):上海巖芯數(shù)智人工智能科技有限公司(下稱:“RockAI”)
RockAI CEO劉凡平
《科創(chuàng)板日?qǐng)?bào)》12月2日訊(記者 張洋洋)在張江人工智能島上,RockAI是島內(nèi)為數(shù)不多的從底層架構(gòu)做起,直接切入大模型賽道的創(chuàng)業(yè)公司。但與絕大多數(shù)大模型公司們相比,這家初創(chuàng)企業(yè)又稍顯另類——在技術(shù)路徑上,其選擇了非Transformer架構(gòu)。
今年1月,RockAI推出了國(guó)內(nèi)首個(gè)非Transformer架構(gòu)、非Attention機(jī)制的大模型Yan1.0。9月,這家公司將其大模型迭代至具有多模態(tài)能力的Yan1.3模型,還實(shí)現(xiàn)了在手機(jī)、電腦、機(jī)器人、無人機(jī),甚至樹莓派等廣泛設(shè)備端上的無損部署。
談及走一條非主流的技術(shù)路徑,RockAI CEO劉凡平坦言在早期外部并不理解為何我們選擇了這樣一條路。
相較于Transformer架構(gòu),非Transformer的Yan模型好處在于,能耗低、成本小、落地周期快。
有過連續(xù)創(chuàng)業(yè)經(jīng)歷的劉凡平,深刻理解商業(yè)的成本投入和價(jià)值產(chǎn)出,在現(xiàn)實(shí)的商業(yè)經(jīng)營(yíng)面前,他選擇頂住壓力,專注走非主流道路。一年多之后,當(dāng)Yan模型的技術(shù)能力,以領(lǐng)先同行的進(jìn)度,快速落地在如手機(jī)、AI PC的產(chǎn)品上的時(shí)候,劉凡平才確認(rèn),自己扛過來了。
“這趟去深圳,客戶和合作伙伴塞了一堆東西給我們,都是在問,可不可以給他們的安卓手機(jī)、筆記本電腦都裝上大模型?!眲⒎财较颉犊苿?chuàng)板日?qǐng)?bào)》記者坦言,“現(xiàn)在的最大壓力,反而是快速交付。”
RockAI是上海巖山科技股份有限公司旗下,致力于讓世界上每一臺(tái)設(shè)備都擁有自己智能的大模型企業(yè)。在這家公司坐落的張江人工智能島3號(hào)樓,周邊分布著百度、阿里、IBM、微軟等科技巨頭。大廠環(huán)繞,在劉凡平看來,對(duì)于RockAI而言是好事,因?yàn)檫@意味著產(chǎn)業(yè)鏈的集聚。
以百度、阿里和巖芯數(shù)智等為代表的大大小小的AI企業(yè)集聚于此,這周邊已經(jīng)形成了一個(gè)AI生態(tài)圈。AI浪潮加速推進(jìn),張江人工智能島,也正成為上海發(fā)展人工智能產(chǎn)業(yè)高地的重要承載區(qū)。
▍讓大模型更像“人”
在最近一次的開放日活動(dòng)中,RockAI正式推出全新升級(jí)的Yan1.3大模型,并展示了其在無人機(jī)、機(jī)器人、PC、手機(jī)等各類終端設(shè)備上落地能力。
相較于1月份首發(fā)的Yan1.0只能處理自然語(yǔ)言,Yan1.3具備了多模態(tài)能力,可處理圖文及語(yǔ)音等多模態(tài)信息,并實(shí)現(xiàn)了模型在更廣泛設(shè)備端上的離線無損部署,普通電腦CPU上也能夠流暢運(yùn)行。
區(qū)別于當(dāng)下多采用的云、邊、端協(xié)同部署模式,Yan架構(gòu)大模型能直接部署在設(shè)備端,且能夠在較小的算力情況下實(shí)現(xiàn)較高的性能。
在接受《科創(chuàng)板日?qǐng)?bào)》采訪時(shí),巖芯數(shù)智CEO劉凡平坦言,從行業(yè)敘事看,大部分人工智能從業(yè)者所置身的是一場(chǎng)“由OpenAI提出概念,Meta負(fù)責(zé)開源,國(guó)內(nèi)市場(chǎng)專注應(yīng)用”的技術(shù)接力賽。RockAI不想跟隨。
算經(jīng)濟(jì)賬,Transformer架構(gòu)的Attention機(jī)制,算力耗費(fèi)高、數(shù)據(jù)需求大,交付成本也高,成本難以覆蓋客戶的付費(fèi),不少中小型企業(yè)望而卻步。他們因此在早期就放棄了基于Attention機(jī)制的Transformer架構(gòu)大模型。
最近的面試,劉凡平說自己會(huì)經(jīng)常問候選人一個(gè)問題:如果有一天你要離開這個(gè)世界,你希望在自己的墓志銘上寫什么?
他稱,對(duì)多數(shù)人而言,這是一個(gè)需要思考超過30秒甚至更長(zhǎng)時(shí)間的問題,但是在Transformer機(jī)制下,大模型會(huì)馬上輸出答案。
“這是Transformer大模型與人類大腦工作機(jī)制的不同,人類回答輸出的時(shí)間會(huì)根據(jù)問題的復(fù)雜程度變化,復(fù)雜問題求解時(shí)參與的神經(jīng)元變多了,所以輸出時(shí)間會(huì)變長(zhǎng)。但現(xiàn)在的大模型在面對(duì)這個(gè)問題時(shí),即使是很復(fù)雜的問題,它的輸出速度是一樣的?!?/p>
本質(zhì)來說,劉凡平認(rèn)為大模型應(yīng)當(dāng)模擬人腦的方式來工作,而不應(yīng)該是Transformer架構(gòu)大模型中那樣無時(shí)間差別的輸出。也是劉凡平和他的團(tuán)隊(duì)放棄Transformer架構(gòu),選擇自研架構(gòu)的一大原因。
劉凡平說RockAI的愿景,是讓世界上每一臺(tái)設(shè)備都擁有自己的智能,同時(shí)通過群體智能實(shí)現(xiàn)通用人工智能。他期望大模型更像人,自研的Yan模型,是群體智能單元大模型,它會(huì)則更注重模擬人腦的工作機(jī)制,通過多個(gè)智能單元的協(xié)作和交互,形成的集體智慧和決策能力,能夠具備超越單元個(gè)體的能力。
在RockAI的規(guī)劃中,群體智能的實(shí)現(xiàn)包括四個(gè)階段:創(chuàng)新性基礎(chǔ)架構(gòu)、多元化硬件生態(tài)、自適應(yīng)智能進(jìn)化、協(xié)同化群體智能。目前,Yan1.3已經(jīng)可以在廣泛的設(shè)備上部署和應(yīng)用,進(jìn)入到了多元化硬件生態(tài),下一階段是自主學(xué)習(xí)。據(jù)劉凡平透露,Yan2.0計(jì)劃在明年發(fā)布。
▍讓AI落地端側(cè)
劉凡平是中國(guó)科學(xué)技術(shù)大學(xué)計(jì)算機(jī)專業(yè),科班出身,研究生生涯一半時(shí)間在微軟度過,畢業(yè)后進(jìn)入百度。從大廠出走后的第一次創(chuàng)業(yè),就是搜索引擎,放在當(dāng)下的生成式AI語(yǔ)境下,這就是ChatGPT的雛形版。
早期的求學(xué)和后來的工作經(jīng)歷,劉凡平一直與人工智能打交道。作為這個(gè)行業(yè)的連續(xù)創(chuàng)業(yè)者,他對(duì)完善的、能快速奏效的商業(yè)閉環(huán),有著異乎常人的關(guān)注。這一方面是連續(xù)創(chuàng)業(yè)經(jīng)驗(yàn)帶來的條件反射,同時(shí)也是在燒錢的AI行業(yè)里避坑。
商業(yè)閉環(huán)對(duì)應(yīng)的是應(yīng)用落地。過去兩年,大模型,尤其是基礎(chǔ)模型的技術(shù)進(jìn)步,日新月異,但其中也有不少質(zhì)疑的聲音,技術(shù)發(fā)展這么快,真正的落地應(yīng)用在哪里?今年,行業(yè)的討論集中在了大模型的應(yīng)用上。
劉凡平告訴《科創(chuàng)板日?qǐng)?bào)》記者,RockAI的策略是,快速推進(jìn)Yan模型在更廣泛的終端落地應(yīng)用。
從行業(yè)發(fā)展方向來看,大模型落地設(shè)備端是一個(gè)明顯的趨勢(shì)。在設(shè)備端的場(chǎng)景,國(guó)內(nèi)多個(gè)廠商已在搶占生態(tài)位,手機(jī)端目前最受市場(chǎng)關(guān)注,尤其是蘋果AI的發(fā)布,帶動(dòng)了AI手機(jī)的資本熱潮。
類似于手機(jī)的大范圍應(yīng)用,一個(gè)技術(shù)產(chǎn)品要觸達(dá)最廣泛的用戶,需要靠設(shè)備,它可以是監(jiān)控的設(shè)備,也可以是家里的設(shè)備,也可以是辦公場(chǎng)景的設(shè)備,設(shè)備才是真正毛細(xì)血管,觸達(dá)到千千萬萬的用戶。
對(duì)于目前的市場(chǎng)競(jìng)爭(zhēng)形勢(shì),劉凡平表示,硬件更新周期長(zhǎng),比如手機(jī)的更新是一年一次,這里就留下了足夠長(zhǎng)的時(shí)間窗口去和設(shè)備廠商做適配。且某個(gè)大模型的一旦占據(jù)了某個(gè)設(shè)備型號(hào),其他廠商并不容易替換,要么就等下一次的新機(jī)型。硬件廠商選擇供應(yīng)商也十分謹(jǐn)慎,從實(shí)際落地上來說,設(shè)備更容易形成壁壘。
在近期的開放日現(xiàn)場(chǎng),RockAI重點(diǎn)展出了Yan1.3在機(jī)器人、PC、手機(jī)、無人機(jī)等各類終端設(shè)備上的落地。例如,飛龍無人機(jī)能在設(shè)備端實(shí)時(shí)處理聲音、圖像及文字等模態(tài)信息,無需經(jīng)由云端處理判定再發(fā)回設(shè)備端執(zhí)行;胖虎機(jī)器人可在離線的情況下理解模糊指令,展現(xiàn)“七步成詩(shī)”、“詠春拳法”等;在PC上的迅兔智能助手可以在離線模式下聽懂語(yǔ)音指令、看懂圖片并快速搜圖。
據(jù)劉凡平透露,目前RockAI已在機(jī)器人和AI PC、手機(jī)等產(chǎn)品上具備交付能力。
劉凡平認(rèn)為,在AGI這個(gè)終極命題下,無論是云端還是端側(cè),都只是實(shí)現(xiàn)智能普惠及躍遷的一個(gè)載體。他始終堅(jiān)信,只有真正提升每一臺(tái)設(shè)備的自我學(xué)習(xí)能力,才能激發(fā)更高級(jí)別智能形態(tài)即群體智能的涌現(xiàn)。
▍離開又回到張江
劉凡平是后來帶著獨(dú)立創(chuàng)業(yè)的RockAI回到張江的。在此之前,他在當(dāng)?shù)氐纳鲜泄編r山科技履職。目前,RockAI已經(jīng)是巖山科技獨(dú)立的人工智能業(yè)務(wù)板塊。
之所以繼續(xù)回到張江發(fā)展,既有前東家的邀約,也有當(dāng)?shù)禺a(chǎn)業(yè)鏈的集聚效應(yīng)吸引。
RockAI現(xiàn)在坐落于張江人工智能島3號(hào)樓,周邊分布著百度、阿里、IBM、微軟等科技巨頭。這附近,也是上海發(fā)展人工智能產(chǎn)業(yè)高地的重要承載區(qū)。
劉凡平表示,產(chǎn)業(yè)上的大廠環(huán)繞,一定程度上可以鏈接更多合作伙伴。RockAI目前被視為張江重點(diǎn)人工智能企業(yè),當(dāng)?shù)卣步o予了諸多支持。今年元旦前后,RockAI就將搬入張江的大模型產(chǎn)業(yè)生態(tài)集聚區(qū)“模力社區(qū)”,這些場(chǎng)地,當(dāng)?shù)匾步o予了場(chǎng)地租金的優(yōu)惠支持。
AI行業(yè)未來面臨的星辰大海和公司當(dāng)下快速的發(fā)展線軸,為劉凡平的創(chuàng)業(yè)增添不少信心。RockAI巖芯數(shù)智目前的團(tuán)隊(duì)規(guī)模約為50人,但交付跟不上,也困擾著他。
“其實(shí)現(xiàn)在我們也需要去擴(kuò)大團(tuán)隊(duì)規(guī)模,尤其是市場(chǎng)團(tuán)隊(duì)、交付團(tuán)隊(duì),這塊的建設(shè)可能會(huì)投入更多,此外還會(huì)再在技術(shù)研發(fā)上繼續(xù)做投入?!彼f。