①“我可能相對比較悲觀,不覺得中國的GPT賽道中,在短時間內會出現可以跟GPT-4一較高下的大模型?!?②P對于創(chuàng)業(yè)公司而言,做底層基礎大模型的難度較難,機會主要集中在對基礎模型的調參以及具體應用上。
《安安訪談錄》是界面財聯社執(zhí)行總裁徐安安出品的一檔深度訪談類欄目。從投資角度對話1000位行業(yè)領軍人物,覆蓋傳媒創(chuàng)新、VC/PE、信息服務、金融科技、交易體系、戰(zhàn)略新興等方向。
科創(chuàng)板日報《連線創(chuàng)始人/CEO》是由《安安訪談錄》出品的針對創(chuàng)新創(chuàng)業(yè)型未上市企業(yè)創(chuàng)始人的訪談欄目,以企業(yè)創(chuàng)始人/CEO的訪談為一手信源,讓成長中的創(chuàng)業(yè)公司走入公眾和市場視野,并發(fā)掘最新技術和產業(yè)趨勢。
本期訪談人物:
大模型特別考驗一個公司能否實事求是、腳踏實地做事情。
▍個人介紹
冰鑒科技創(chuàng)始人兼董事長顧凌云畢業(yè)于卡內基梅隆大學計算機學院并獲博士學位,專注人工智能領域25載。顧博士已獲得近190項中美發(fā)明專利及軟件著作權,并發(fā)表20余篇學術論文。榮獲國家科技部創(chuàng)新人才、上海浦東開發(fā)開放30周年有突出貢獻科技工作者、《哈佛商業(yè)評論》拉姆·查蘭管理實踐獎等多項榮譽。
顧博士于2015年創(chuàng)辦冰鑒科技,其AI解決方案已在金融、安防、政務、醫(yī)療、教育等多個行業(yè)場景落地,始終致力于以人工智能技術推動中小企業(yè)數字化轉型。
▍第一標簽
NLP(自然語言處理)前沿探索者,“AI+金融”知行合一
▍企業(yè)簡介
冰鑒科技是以人工智能技術提供企業(yè)級服務的高科技公司,成立8年來積極探索AI在各行業(yè)的應用,客戶包括國有六大行在內的一千多家銀行、保險、消金公司、政府企事業(yè)單位等。近年來冰鑒科技響應國家“一帶一路”建設號召,客戶已遍布新加坡、泰國、馬來西亞、柬埔寨等東南亞諸國及北美、大洋洲、拉美等地區(qū)。
要說近來科技最熱的領域方向,ChatGPT所引爆的生成式人工智能熱潮絕對是繞不開的一個詞。
截至目前,國內的科技公司、高校、研究機構已發(fā)布了30多款AI大模型產品。在百度文心一言最先公開邀測后,阿里、知乎等互聯網企業(yè),科大訊飛、商湯、云從等AI公司的大模型先后亮相……
在國內GPU仍整體受限的情況下,缺乏算力支持的大語言模型領域為何看似一片繁榮?這波ChatGPT國產浪潮如何直面海外競爭,將去往何方?近日,記者采訪了冰鑒科技創(chuàng)始人顧凌云,暢談了對于國產版ChatGPT 的看法。
——安安訪談錄
01
——————————
短期內超越GPT-4很難
“我可能相對比較悲觀,不覺得中國的GPT賽道中,在短時間內會出現可以跟GPT-4一較高下的大模型。” 顧凌云向記者直言。
其中的一大限制因素在于算力。作為大模型研發(fā)中必不可少的三大基礎要素,算力是制約大模型成果水平的關鍵因素。
在國內還處于GPU整體受限的情況下,大語言模型之所以呈現出一種比較繁榮的景象,顧凌云表示,是因為國內還有不少存量GPU,以支撐目前這一波的大語言模型訓練。
“主要國內還有一部分存貨,現在像英偉達A100的價格都炒得挺高,但以后就不可持續(xù)了。而算力對于大模型的訓練速度有決定性影響。英偉達的3090在訓練速度方面比起A100,要慢很多。這也意味著,我們用同樣的錢訓練大模型,要花費比別人多幾倍的時間。而且每次訓練,并不能保證結果一定對的。訓練了半天結果不對,還要再進行下一次訓練。這極大地阻礙了國內想要追趕ChatGPT的腳步?!?/p>
同時,從算法層面來說,ChatGPT產生的效果雖是王炸型的,但實際其技術是漸進式的,依靠的是算力和數據支撐下的長期迭代。
“通過大量基于GPU的有效訓練,GPT把大量數據經過不斷的人工標注,以及一次一次的迭代,最后在漸進式的累積下出現了量變到質變的結果。在GPT已經擁有了先發(fā)效應的情況下,國內企業(yè)在硬件、軟件以及用戶數據積累上都不具備優(yōu)勢?!?顧凌云坦言。
截至目前,國內已發(fā)布了30多款AI大模型產品。包括百度、阿里等互聯網企業(yè)的大模型產品陸續(xù)亮相。在這些大廠中,顧凌云較為看好阿里和騰訊的后續(xù)進展。“騰訊在自然語言處理方面做得不錯。我認為,大模型特別考驗一個公司能否實事求是、腳踏實地做事情?!?/p>
02
——————————
創(chuàng)業(yè)公司的機會在模型層和應用層**
大模型產業(yè)鏈,可簡單分為提供算力的基礎層、模型層和應用層。對于創(chuàng)業(yè)公司而言,做底層基礎大模型的難度較難,機會主要集中在對基礎模型的調參以及具體應用上。
“大廠已經修了從上海到南京的高速公路了。創(chuàng)業(yè)公司最多再修一條滬寧高速公路二號通道。不可能每家都去修高速公路,這沒有意義。創(chuàng)業(yè)者在行業(yè)模型或者針對企業(yè)的定制化模型上,會有更多的機會?!?顧凌云分析。
在具體的應用場景上,顧凌云看好增強現實AR、市場營銷、文本分析等領域的發(fā)展。
“通過AIGC來生成文本,在此基礎上進行修改。企業(yè)可最大限度地提高勞動效率。我相信,很多常規(guī)性、事務型的工作都可能被AIGC所取代,但有創(chuàng)造性的工作并不用擔心?!?/p>
顧凌云以炒股為例,“以前大家要閱讀各種文章、訂閱很多周刊,了解行業(yè)專家到底怎樣分析的,然后再決定如何投資。未來,可用GPT算法對這些數據直接進行分析,來提供炒股建議。像會后總結這些有固定模板的內容,也都能交給AI來生成?!?/p>
此外,GPT模型在醫(yī)療領域的應用潛力也受到關注。目前,GPT模型已貫穿從診前到診后的整個臨床流程。比如,在診前階段,GPT模型可利用的資料檢索和推理能力增強對患者疾病的預測,從而提升分診導診的準確性。在診中階段,GPT模型有望在輔助診斷、AI影像及手術機器人等多個細分場景發(fā)揮作用。
其中,輔助診斷是GPT模型應用在醫(yī)療領域的焦點所在?;诨颊叩牟v、癥狀和疾病歷史等多模態(tài)數據,GPT模型通過數據分析和智能算法可為醫(yī)生提供輔助診斷、指導治療方案和預后方案。
“在醫(yī)藥的研制創(chuàng)新、醫(yī)療診斷等不同的領域。GPT模型均有應用的空間。” 顧凌云說,“特別是在輔助診斷方面,GPT模型有很大的發(fā)揮價值。大模型可以分析病人的癥狀,輔助醫(yī)生進行開藥,并追蹤后續(xù)病人的癥狀是否得到緩解改善?!?/p>
03
——————————
把金融領域的算法做到最優(yōu)
展望未來,人工智能的應用將向縱深進一步發(fā)展,而不僅僅是在寬泛的領域當中進行大規(guī)模的應用,因而豐富智能化應用場景變得非常重要。
據悉,冰鑒科技在金融、保險、政府服務等領域均已開展探索。5月20日,在江蘇發(fā)展大會上,顧凌云博士代表冰鑒科技推出面向銀行和保險領域的、具有自主知識產權的大語言模型——本立道生(Origin One)。
“我們更多是在銀行保險領域的營銷、反欺詐等方面。在大語言模型的基礎上,把這一場景的底層代碼,調優(yōu)成效果最好的算法,這是我們最近三年的目標?!?顧凌云提到。
ChatGPT熱潮引發(fā)關注的同時,其技術合規(guī)和安全性亦備受重視。4月11日,中國國家網信辦正式發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》(下稱“意見稿”),促進生成式人工智能技術健康發(fā)展和規(guī)范應用。
“這確實是非常重要的點,但迄今還沒得到解決。”顧凌云說,“現在還很難判斷,AI的回答究竟是恰如其分,還是超出了規(guī)范。就連OpenAI也沒有解決這一問題。從真正的監(jiān)管角度來說,算法不僅僅要能夠生成內容,還要能識別對方的提問,是否在設置陷阱讓AI往里面跳?!?/p>
“經過兩三年更新迭代后,GPT可能不會再犯這樣的錯誤,但是現在仍比較困難。” 顧凌云判斷。