①我們身處何種時代?唯一不變的是變化本身 ②擁抱通用人工智能技術革命時代 ③百花齊放:大模型的場景與應用 ④大模型的成本與價值 ⑤對策與路徑:如何實現(xiàn)大模型更好落地
財聯(lián)社12月26日訊(編輯 李夢琪 王澤坤)我們顯然已經(jīng)進入一個前所未有的技術加速度發(fā)展的創(chuàng)新時代。2023年以來,以ChatGPT為代表的大模型、人工智能等新技術突破為各行各業(yè)發(fā)展帶來新的前景。電商、醫(yī)療、教育等行業(yè)頭部企業(yè)都在積極探索AI+賦能產(chǎn)業(yè)發(fā)展的新路徑。
在這樣的時代背景下,大模型的場景與應用是否真正如大家看到的那般,呈現(xiàn)百花齊放的格局與生態(tài)?我們推進大模型應用過程中,需要承擔哪些成本?又將能夠為企業(yè)生產(chǎn)發(fā)展帶來怎樣的價值?以及大模型如何實現(xiàn)更好落地?
聚焦上述問題,復旦大學計算機科學技術學院教授、博士生導師,上海市數(shù)據(jù)科學重點實驗室主任肖仰華在“2023復旦管院科創(chuàng)周”之復旦科創(chuàng)先鋒年度論壇上以《走向千行百業(yè)的大模型》為主題分享了對大模型產(chǎn)業(yè)應用的見解,他認為生成式語言模型已經(jīng)逐步向多模態(tài)、具身化快速發(fā)展,這一系列的發(fā)展趨勢形成合力,將會為人們帶來一場前所未有的 “通用人工智能技術革命”。
今天,我們系統(tǒng)地整理了肖仰華的演講內容,用萬字長文解讀其對大模型的前沿分析,以下為分享內容:
一、我們身處何種時代?唯一不變的是變化本身
我們所有的行業(yè)從業(yè)人員,自ChatGPT去年11月底上線以來,這一年是夢幻般的一年,這一年里,我們看到ChatGPT在不到2個月的時間里突破了1億的月活,而此之前最快的TikTok實現(xiàn)1億月活的用戶為9個月,我們似乎一覺醒來就會見證了一些新的技術到來,我們IT研發(fā)人員,這一年每天早晨一開始都是一個新的開始,每天早晨最擔心的第一件事兒是不是又發(fā)生了什么新的技術變革,我們這個飯碗還能不能端得穩(wěn),很多新技術的名詞層出不窮,我們還沒有弄明白一個新概念是怎么回事兒,另外一個更新的技術又冒出來了,我們似乎處于前所未有的技術加速發(fā)展的時代,唯一不變的是變化本身。
這樣一個快速變化的技術世界帶來的是這個世界日益復雜。
以一輛整車為例,有將近2萬到3萬個零部件,每一個零部件需要經(jīng)歷數(shù)萬個零件組合而成的生產(chǎn)線,這樣的加工流程可能有700多道程序。所以我們整個人類社會日益變成了人、機、物融合的復雜系統(tǒng),這個系統(tǒng)的復雜性可以說是前所未有。實際上我們整個人類現(xiàn)代文明早就經(jīng)歷了早期的嬰童階段,而進入當下高度復雜的成熟階段,“復雜”往往是“成熟”另外一個同義詞。
快速發(fā)展的世界、日益復雜的世界帶來的是人類很多社會系統(tǒng)不確定性增加。我們看到所謂的“黑天鵝事件”“灰犀牛事件”高頻發(fā)生。我們又看到,當下老齡化的趨勢加重,各種自然災害頻發(fā),國際經(jīng)濟的競爭形勢也在加劇,氣候、病毒等各種因素疊加在一起,給整個世界的發(fā)展帶來了巨大的不確定性。
在上世紀90年代,社會學家和經(jīng)濟學家已經(jīng)在警告我們,技術發(fā)展有可能帶來整個社會發(fā)展的失速,而帶來所謂的失控風險??梢哉f當下我們全人類最大的問題、命題是如何應對日益失控的風險,但是我們人作為一種生物智能,我們每一個人的認知能力是有限的,我們在座每一個人差不多10億個神經(jīng)元,1萬億左右神經(jīng)突觸參數(shù),而且今天的人類并不比1000年前的人類聰明多少。我經(jīng)常開個玩笑,如果大家真的穿越到古代1000年前的宮廷里,生存1個小時都是很困難的。這說明我們并不比古人聰明多少。這些事實說明我們人類的認知受限于生物智能的本質,其能力是有限的,而我們有限的認知能力難以認知當下快速變化、日益復雜、日益不確定性的世界,這是當下人類最大的問題。我們一定要把認知能力讓渡給機器,讓機器也一定程度上具備人的認知能力,進而開展人機協(xié)作的認知,才有可能認知日益加速變化、日益復雜的世界。
我們一旦把認知能力賦予了機器,機器的認知能力是可以隨著世界復雜性的增長而增長。我們看到現(xiàn)在機器智能,只要喂給它的數(shù)據(jù)越來越多,只要供養(yǎng)它的算力越來越多,它的智能仍然在持續(xù)增長,唯有機器形成認知世界的能力,它才有可能跟世界復雜性的增長同步。所以,未來的認知模式一定是人機協(xié)作的認知模式。
當下很多技術的出現(xiàn),某種程度上是時代發(fā)展的必然,是時代發(fā)展到今天對技術所提出的必然要求,我們必須發(fā)展人機協(xié)作的認知,人機協(xié)作的認知結果就是大家熟知的ChatGPT這一類的大模型,大模型可以認為是機器認知這個世界的一個技術成果。
我們看到的大模型,嚴格來講是大規(guī)模的生成式語言模型,它已經(jīng)能夠在絕大部分人類所擅長的認知任務中,比如說自然語言處理、理解,超過人類的水平,甚至達到的專家的水平,可以說生成式大模型出現(xiàn)具有時代發(fā)展的歷史必然性,它是機器發(fā)展認知智能的必然趨勢。
二、擁抱通用人工智能技術革命時代
而這樣一個趨勢在快速的發(fā)展中,我們看到不單單是機器人理解我們千行百業(yè)的文本,它又進一步快速向多模態(tài)發(fā)展,可以理解圖像,理解我們現(xiàn)場的照片,并且做出非常精妙的回答,甚至可以像剛才說的機器人,它可以操控機械臂,完成一些只有人類才可以完成的復雜規(guī)劃任務。也就是說生成式語言模型已經(jīng)逐步向多模態(tài)、具身化快速發(fā)展,這一系列的發(fā)展趨勢形成合力,帶來的是一場前所未有的技術革命。我們把這場技術革命稱為“通用人工智能技術革命”,因為它已經(jīng)讓一些機器具備了一般人的認知能力,具備了開放世界的理解能力,而且這種通用人工智能技術革命絕不是傳統(tǒng)意義上的某一次技術革命所能比擬的。
我們所熟知的蒸汽革命、電氣革命,本質上都是人類智能本身的產(chǎn)物,唯獨這一次的通用人工智能技術革命,革的是智能本身的命。大家想想看,人類社會生活、學習、工作中哪一個活動不需要使用我們的智力呢?但凡將來用到我們人類智力的所有活動,都有望被通用人工智能重新塑造。可以說通用人工智能將會滲透整個社會生產(chǎn)、生活中的每一個角落,將會滲透進社會的每一根毛細血管,所以它對人類社會影響將是廣泛且深遠的。所以我一直把通用技術革命視作是一場元革命,它不是某一次技術革命的地位所能比擬的。
這么一場技術革命,對于我們各行各業(yè)會產(chǎn)生什么樣的影響?各個行業(yè)為什么從戰(zhàn)略上如此高度重視這場技術革命?我們先來看認識層面上一些思考。
所謂的千行百業(yè),大家所從事的行業(yè),本質上都是某一個垂直行業(yè)。我們以前做人工智能,做了很多年各行各業(yè)的智能化解決方案,但是我們發(fā)現(xiàn)一直以來效果不好,直到后來ChatGPT出現(xiàn),我們再去跟很多行業(yè)專家去聊,我們才發(fā)現(xiàn)通用人工智能、通用大模型的到來,實際上恰恰是發(fā)展領域智能不可或缺的。
我們知道通用大模型是通過通用語料煉制出來的,它看了很多互聯(lián)網(wǎng)上各種學科知識,可以說它是一個通才。一個垂直領域智能化為什么需要通識能力?你跟醫(yī)生聊的時候,你發(fā)現(xiàn)一個醫(yī)生80%的情況會排除你是健康的情況,可能10個病人只有8個是健康的,只有2個是需要醫(yī)生干預的,也就是說它想了解什么是疾病,恰恰先要理解什么是健康。推而廣之,你不理解美怎么可能理解丑呢?所以你想理解某一個領域內概念,恰恰要先了解領域外的概念。
所以我們這一波行業(yè)智能化解決方案,恰恰是先走通通用認知能力,因為我們只有建立起通識能力才有可能發(fā)展專業(yè)認知能力,通識是專識的基礎。
我們人類的教育也是這樣,我們先經(jīng)歷了K12的基礎教育,主要是完成通識教育,然后是大學的專業(yè)教育。所以沒有通識能力是不可能有垂直行業(yè)的領域認知能力的。
我們這一波大模型本質上帶來了什么新的能力?首先是帶來開放世界的理解能力。比如說這里有一個藥品說明書,顯示了各個年齡層次服用藥劑的方法,可是一般老百姓去問藥的時候,通常說“我今年23歲了,男性,我應該怎么使用這個藥”。以前的人工智能技術很難理解這類開放性表達,但是今天有了通用大模型能力,可以準確理解23歲是成年男性,可以匹配文檔中相應的劑量來做出準確回答,本質上這是通用人工智能的開放理解能力給我們帶來的效果。
現(xiàn)在的大模型又有著非常強大的組合創(chuàng)新能力,所謂的舉一反三,學會了解決A任務、B任務的能力,就可以泛化出解決A+B任務的能力。我們以前人工智能解決方案非常痛苦,要教機器A任務的能力、B任務的能力,可是實際的用戶往往給的真實任務是A+B任務,我們的方案就不行了,但是今天大模型可以準確泛化出新的組合任務的能力,這是大模型給我們帶來的新價值。大
模型的評估評價能力,第一次達到人類的專家水平。我們以前很多評價任務一定要交給人類去做,比如說習語翻譯,這是一個非常專業(yè)的成語翻譯任務,通常需要找一個英語專業(yè)四級同學來標注翻譯的好壞。今天使用超級大模型,比如說GPT4,我們只要能夠寫出這個任務的評價標準,以及一步一步評價的過程,大模型就能夠像人類專家一樣來做非常專業(yè)工作的評估和評價。所以基本上我們很多專評估評價業(yè)工作都可以交給大模型。
大模型的復雜任務的規(guī)劃能力,使得很多知識工作自動化得以可能。舉個管科同學經(jīng)常要做的數(shù)據(jù)分析的案例。比如,我要大模型幫我做個調研,對比分析上海和北京近十年來每年8月份的平均氣溫,并形成統(tǒng)計結論,并且做假設檢驗。這樣一個活如果讓在座的研究生同學去做,可能要找數(shù)據(jù),找軟件,做分析,做統(tǒng)計,做假設檢驗分析,最后形成結論,我估計要花半天時間。但是今天我們借助大模型強大的規(guī)劃能力,只需要一秒鐘時間,就把你手工干的所有活全部自動化干完。這是好事兒也是壞事兒,好事兒意味著你只要能夠熟練使用大模型就不用花這么多時間手工工作,壞事兒是你的常規(guī)數(shù)據(jù)分析工作有可能被機器所替代。隨之而來的,是在AGI大量應用的未來,我們相對于機器的獨特價值是什么將會是我們需要日益深入思考的問題。
大模型另外一個非常重要的機遇在于它給我們提供了跨領域、跨專業(yè)知識,尤其是跨系統(tǒng)邊界的知識。大模型是巨大的知識容器,尤其擅長在一些跨學科邊界處的知識,可能是人類所不具備的。
最近有一個新聞,他說一個小女孩兒得了個怪病,看了人類近14個??漆t(yī)生都搞不定,最后問ChatGPT,ChatGPT做出了正確診斷。我傾向認為這個新聞是真實的,因為大模型學會了各個學科的知識,而且它在各個學科的知識專業(yè)水平比普通人顯著高出一截,我們每一個專科醫(yī)生往往在自己的??剖且蛔R的高峰,但是你很難在所有的??贫际且蛔R的高峰,大模型全域認知水平線顯著提升之后,就能夠認知兩個病種之間的盲區(qū),這是人類歷史上第一次有機會做到這件事,而我們每一個人類是難以做到這一點的,我們能夠擅長某一個領域已經(jīng)非常不容易了,但是今天大模型很可能在很多系統(tǒng)邊界處有著非常強大的認知能力。
管科的同學肯定都聽說過管理上難題有一些難度,我們一旦聽到跨部門、跨層級、跨專業(yè),有一個“跨”字基本上意味著難題所在,我們每一個人的認知只能擅長自己各自的小領域,而不同的部門、不同學科之間認知往往是一個巨大的盲區(qū),這恰恰是大模型未來給我們帶來的重大機遇。大模型所能認知的跨學科知識,其很多內容可能是人類從未探索或觸及的,所以大模型給我們帶來的機會有可能是前所未有的。
回到我們的千行百業(yè),正是因為大模型具備這些能力,我傾向于認為大模型這一次對于行業(yè)發(fā)展來講,對于to B行業(yè)發(fā)展來講,是一次全新的智能引擎升級。這就像一輛車,我們車發(fā)展了幾百年,這個車還是一個殼子、四個輪子,這個車到底變革的是什么?變的是它的引擎,從開始的馬力,到后來的蒸汽,再到后來的油氣,再到現(xiàn)在的電動,所以引擎一直在驅動車的變革。
我們的信息化服務、數(shù)字化、智能化也發(fā)展了幾十年,從傳統(tǒng)的小模型發(fā)展,比如基于少數(shù)參與的回歸、分類模型、預測,這些小模型的表達能力有限,難以表達復雜的現(xiàn)實世界。再到過去的知識工程,用專家知識來解決問題,但是專家知識一旦遇到開放問題就難以勝任,所以傳統(tǒng)的引擎多多少少有缺陷,我們今天把它革新為新的大模型引擎,用整個大模型驅動to B的數(shù)字化和信息化過程當中,一定要重視幾個問題:
1. 大模型是一次引擎的升級,所以它一定要做到和現(xiàn)有流程的無縫融合;
2. 大模型仍然還需要和行業(yè)的從業(yè)人員進行有效的協(xié)作;
3. 要往大模型里注入千行百業(yè)的知識,才有可能解決大模型的所謂根本問題,叫“幻覺問題”。
我想強調的是toB行業(yè)應用本質是一類復雜、嚴肅的決策任務,我們所熟知的ChatGPT最成功的應用目前是聊天,但是這個聊天不是一個嚴肅應用的場景,你不會因為它聊天出錯就認為它聊得不好。,說嚴肅應用場景像醫(yī)療決策、投資決策,這些都屬于復雜決策,需要有專業(yè)的知識,更要有復雜的決策能力,比如說投資決策,一定要有宏觀態(tài)勢的研判能力,還要有綜合任務拆解能力、復雜約束的取舍能力(有那么多的約束要考慮)、未知事物的預見能力、不確定性場景的推斷能力等等,這都是我們做決策的時候所要具備的能力。從這些條件、要求來看現(xiàn)在的大模型,仍然還是有漫長的路要走。
在這個過程中,大模型想在千行百業(yè)創(chuàng)造價值,首要解決的問題是它所謂的“幻覺問題”,也就是一本正經(jīng)的胡說八道,如果大家問它復旦的校訓,它一本正經(jīng)的給你回答,但是你仔細一看這個出處是編造出來的,而且大模型這種一本正經(jīng)的文風,實際上使得我們從中識別錯誤異常困難。這是為什么很多嚴肅的場合大家不敢用大模型的一個很重要的原因。比如說醫(yī)療行業(yè),醫(yī)療寫病例或者什么,如果它一本正經(jīng)給你寫了一段病歷,結果有一個小數(shù)點的錯誤都可能是致命的。所以這是大模型往行業(yè)里應用的時候必須要解決的問題。
大模型往往還缺乏領域的忠實度,因為它已經(jīng)在通用領域學到了很多通用知識。但是我們往行業(yè)去用的時候一定是希望大模型能夠根據(jù)行業(yè)的規(guī)范與知識去回答問題。但是它往往對于你行業(yè)所給的這些知識,缺乏必要的忠實度,而傾向于用它所學到的一些通識知識來回答問題。這是所謂的缺乏忠實度給我們帶來的問題。
三、百花齊放:大模型的場景與應用
回到今天,當我們去看大模型往行業(yè)去用的時候,我們一定會去想我們如何在行業(yè)創(chuàng)造大模型的價值,也就是說場景和應用的問題。事實上很多人都在思考類似問題,經(jīng)常有人問我們中國的大模型應該怎么去發(fā)展。事實上,我的一個基本的觀點認為大模型的這個賽道是百花齊放,我們沒有必要都專注在通用大模型,雖然通用大模型很重要,我們還可以發(fā)展很多行業(yè)大模型,甚至可以發(fā)展很多垂直的場景化的大模型,還有很多科學大模型。這個賽道足夠寬廣,我們每一個企業(yè)都可以發(fā)現(xiàn)你屬于自己獨特優(yōu)勢的競爭機會。
尤其我想強調場景化大模型的重要性。大家有沒有發(fā)現(xiàn)人類有一種工作崗位,只需要通識能力再加上簡單的崗位培訓就可以勝任的,比如說客服、HR,你聽說過HR的工作崗位一定要招一個博士學歷的嗎?你聽說過客服一定要招博士學位的嗎?很少,但凡不需要博士學位的崗位都有一個特點,那就是通識能力加上簡單的工作崗位培訓似乎就可以勝任,這一類崗位我把它稱之為“場景”,所有的行業(yè)都需要有HR,所有的行業(yè)可能都存在客服,再比如程序員、圖書管理員,這些行業(yè)有可能是大模型優(yōu)先代替的行業(yè),為什么?因為大模型有通識能力,你再給它簡單的崗位培訓,就足以勝任相應的工作。
這些場景有什么特點?你會發(fā)現(xiàn)這些場景多是所謂的窗口性工作,很多崗位追求服務的標準與規(guī)范,不喜歡創(chuàng)新,必須按部就班,越是這種工作崗位將來越容易被大模型代替。所以你會看到這些場景商業(yè)機會巨大,我們不一定需要卷通用大模型賽道,我希望中國企業(yè)在這些細分賽道與場景進行積極布局。
還有一類是可以競爭的是專業(yè)大模型,我們經(jīng)常說如果我們做一個化工行業(yè)的大模型,必須要讓大模型首先理解什么是化學分子表達式,否則怎樣才能真正理解化學這個行業(yè)呢?所以像化學分子結構這種專業(yè)大模型,還有比如說基因大模型、代碼這些大模型,將來都是我們可以積極作為的新賽道。
大模型應用賽道有一個非常重要的產(chǎn)品形態(tài)是場景化的認知智能體,剛才黃總說的機器人就可以認為是一個智能體。當我們說智能體的時候,強調的是實體機器人或者具備一定環(huán)境自適應的自治能力,它能夠根據(jù)環(huán)境的反饋作出相應的動作來適應這個環(huán)境,所以我們把這種稱之為具備環(huán)境自適應能力的“自治智能體”。
智能體并不是今天才有的概念,其實很早就有了,從人工智能早期誕生開始就有了,但是我們早期的智能體僅限于跟物理環(huán)境做一些簡單的交互,但是今天最大的機會在哪?大模型可以作為智能體的大腦,有了大腦后就可以跟環(huán)境做復雜交互。未來的機器絕不簡單單只是跟環(huán)境做一些物理的交互。它可以跟環(huán)境做非常復雜的認知交互,而成為“認知”智能體。我們將來會有各種各樣的認知智能體。比如說代替你個人,有著跟你一樣的言行和思維方式的智能體,它就可以代替你在網(wǎng)上聊天、閱讀新聞等等。
我們將來會看到各種各樣的認知智能體的出現(xiàn)。比如說我們研發(fā)了一個叫Travel Agent,跟他講我過兩天要到加州,它就會給你去調用互聯(lián)網(wǎng)各種各樣的工具,比如說谷歌地圖、計算器、機票APP、酒店APP,給你制定一個會考慮各種各樣約束(比如你肯定不希望同一個景點玩兩次),并且充分考慮你的個人偏好的Travel Agent。這類Agent將來會在日常的生活中大量普及,這種大模型賦能千行百業(yè),一個非常重要的產(chǎn)品形態(tài)就是各種各樣場景化的Travel Agent。
你可以試圖想一下,你現(xiàn)在干的所有工作,將來都會變成若干個Agent,比如說行政助理定會議室,將來會演變成行政助理Agent,我們人力資源面試工作可以做HR Agent,我到網(wǎng)上查文獻可以做文獻檢索Agent。未來我們身邊會有各種各樣的Agent,來完成各類自動化服務。對于to B企業(yè),我們企業(yè)現(xiàn)在可能已經(jīng)有自己的信息門戶,但是你們現(xiàn)在的信息門戶僅僅是一個信息集散地,它的交互方式還不夠智能,我們往往迷失在信息迷宮中找不到所要的信息、能夠解決特定問題的應用或服務。未來的企業(yè)信息門戶一定是智能化的Agent形式,它能根據(jù)用戶的意圖和企業(yè)現(xiàn)有信息系統(tǒng)進行打交道,并且能夠跨越不同的系統(tǒng)來幫你完成你想做的任務。
我最近正在組織同學幫我們復旦信息化做一個復旦信息門戶Agent,我們每一個同學將來想干的任何事情,比如說我現(xiàn)在想放松一下,打一小時球,它可以自動去找各個校區(qū)哪里的體育館、羽毛球館還可以訂,推薦給你。而,現(xiàn)在,你若要完成干的這樣的事情,必須主動去是需要查找各種APP,甚至你都不知道APP在哪,也往往很難制定準確的關鍵字你也不知道怎么去查找。而Agent技術,有望緩解當下的這些尷尬。,將來它可以幫你干這個事情,這些將來都是會發(fā)生的事兒。
從應用和場景的角度來講,大家一定要注重我國當下正在發(fā)生的一個非常重大的事件,就是數(shù)字經(jīng)濟的發(fā)展,我們國家正在推動數(shù)據(jù)要素的市場化。數(shù)據(jù)從靜態(tài)的變成流通的,變成可交易的,這個時候會創(chuàng)造非常多新的機會。在這個過程當中,大家會發(fā)現(xiàn)我們目前的數(shù)據(jù)要素資產(chǎn)化過程并不流暢,因為我們缺乏智能化手段,數(shù)據(jù)治理仍然是困難重重。但實際上,大模型已經(jīng)一定程度上具備了智能化的數(shù)據(jù)治理能力,可以利用大模型來推動數(shù)據(jù)的智能自動化的治理。比如我這里給了一個例子,給了它四行數(shù)據(jù),然后問大模型這個數(shù)據(jù)有什么問題,大模型已經(jīng)準確識別出了這個數(shù)據(jù)里存在的問題,比如說張三是小明的父親,他出生年齡是1978年,小明出生年齡是1980年,父親是不可能只比孩子大兩歲的,以前我們數(shù)據(jù)中存在一些錯誤,我們人工去寫規(guī)則很難覆蓋各種各樣的情況,今天用大模型基本上可以做到這一點。
四、大模型的成本與價值
所以大模型有可能成為今天數(shù)據(jù)要素釋放價值的一個非常重要的一個工具。但是我們推動大模型往各行業(yè)用的時候,必須要去考慮一個成本和價值的問題。
首先,大模型降低了我們的成本。以前要想實現(xiàn)智能化,要去標數(shù)據(jù),要去定義特征,這都需要成本。但是大模型它本質上是zero-shot learner,它不需要或者只需要很少量標注數(shù)據(jù),就能學到解決問題的能力。所以我們傳統(tǒng)的這些特征工程樣本標注的代價就節(jié)約了。
但是我們一定要注重大模型本身的煉制和使用成本。首先是煉制成本,像GPT4這種規(guī)模的大模型一次訓練需要6300萬美金。非但煉制成本不容忽視,大模型的使用成本更加值得關注,尤其是千行百業(yè)應用大模型時,其應用成本十分突出。比如說一家公司每天要做100萬篇互聯(lián)網(wǎng)文檔內容分析,如果用大模型,比如GPT4的API,一天下來大概要花26萬人民幣。而且大模型還有一個大家難以接受的成本,就是其生成過程需要時間,它把10026萬篇處理一遍的完整生成過程需要15天時間,也就是處理這些文檔的速度遠遠跟不上產(chǎn)生文檔的速度,所以這個時間成本是現(xiàn)實應用難以接受的。
我想告訴大家的是,到今天各行各業(yè)擁抱大模型的時候,一定要注重它的成本問題,如何降低成本?首先是大小模型協(xié)同,我們并不需要在是任何場景都使用大模型,很多情形下時間我們用大模型的使用是殺雞用牛刀,其實小模型仍然有其用武之地,并沒有因此而失效,我們?yōu)槭裁床荒茉诤唵蔚那闆r下用使用傳統(tǒng)的小模型從而降低成本呢?只有在非必要的場合下用大模型呢?甚至我甚至提出一個原則叫“非必要不直接使用大模型”,否則這個成本怎么降低呢?
大家注意到GPT4-Turbo版本頒布發(fā)布的時候,成本降了三分之二,我們認為背后也是用了大小模型協(xié)同,而且大小模型協(xié)同絕不單單是出于成本的考慮,也是出于效果的考慮。小模型在可控、可理解等方面是有大模型不可比擬優(yōu)勢的。大模型不可控,它學到了什么我們不知道,,所以這都是它很大的一個問題??梢哉f,未來商業(yè)價值取決于我們能不能把擅長通識能力的大模型和擅長專業(yè)能力的小模型協(xié)同,才有可能真正的創(chuàng)造我們的商業(yè)價值。
在這里面尤其要注重傳統(tǒng)知識庫的積累,知識圖譜的積累仍然十分重要,知識仍然是緩解大模型的幻覺,降低大模型的應用成本的,這是非常重要的這個思路。我們實際上在大模型的應用的各個階段,在大模型的提示階段、生成階段和評估階段,都要把先驗知識用好,我們才能夠讓大模型廉價的、高效率的為我們服務。尤其還要注重大模型的小型化,真正在一線服務大家的往往是經(jīng)過壓縮的小模型,而不是真正意義上的大模型。還要注重時效性,馬斯克的大模型之所以受到關注,是因為他想解決時效性問題。
五、對策與路徑:如何實現(xiàn)大模型更好落地
到底計算機要做那么什么事情才可以怎樣才能促進大模型更好地落地?
第一,我們要把大模型整個煉制過程變成科學,現(xiàn)在大模型的煉制非常像傳統(tǒng)的煉金術煉丹,把所有的數(shù)據(jù)準備好往服務器一丟,祈禱它出好的效果,實際上整個過程是不透明的,我們要想把它變成透明、科學的,仍然需要努力,其中很重要的努力是對語料做精準的刻畫,我們到底用什么樣的語料能夠練出什么樣的能力,我們要建立起其之間的因果關系,這樣才有可能真正把大模型從煉金術發(fā)展變成科學,這個過程中跨學科研究尤為重要。大模型的能力發(fā)展跟人類的認知發(fā)展理論存在著高度可映射的關系,人類認知發(fā)展什么時候發(fā)展出了注意力,什么時候發(fā)展出了信念,什么時候發(fā)展出了欲望,人類認知過程的大模型很多術語被大量地應用在的在大模型訓練中去使用。這種跨學科的研究視角對于推動大模型訓練工藝變成科學嚴謹?shù)倪^程可能非常重要。
做行業(yè)大模型的時候,尤其要注重數(shù)據(jù)的選擇,不能盲目配比數(shù)據(jù)。到底把什么數(shù)據(jù)配給大模型,它才能夠具備金融從業(yè)人員的專業(yè)認知水平,其實這個是非常有意思的問題,事實上你把一些金融行業(yè)的基礎數(shù)據(jù)讓它去訓練是不夠的,你把一些非常細節(jié)的數(shù)據(jù)(比如每時每刻的股票交易價格)讓它去訓練也是不必要的行的。我們可以多反思一下一個普通人是如何成長為金融專業(yè)人員的,它是因為學到了什么知識才能夠成為金融從業(yè)人員的?我們可以通過回答類似的問題對大模型行業(yè)訓練過程進行指引。
大模型的煉制過程跟我們調教一個行業(yè)專家的過程已經(jīng)高度相似,整個過程中我們尤其要注重高質量指令數(shù)據(jù)的收集,高質量指令數(shù)據(jù)可以釋放底座大模型的價值,反之如果指令數(shù)據(jù)集質量差,會傷害底座大模型的能力。所以行業(yè)大模型最終很大程度上取決于指令數(shù)據(jù)的質量。
整個過程中我們還需要進一步提升大模型的多模態(tài)認知能力,比如說上傳一張票據(jù),問里面包含雞蛋的菜品一共有多少價格,像這種多模態(tài)認知能力在行業(yè)應用中非常有價值,比如大家拍一張亂七八糟網(wǎng)線的接頭照片,問哪里出了問題,像這樣的能力將來大模型一定程度上可以具備。這都是要去提升它的這個多模態(tài)認知能力。
你要讓它成為金融專家,就必須要有金融行業(yè)的評測,你需要發(fā)展面向知識的評測,要去測試這個大模型是否掌握的金融知識,更需要發(fā)展面向能力的評測。,注意有知識的不代表有能力,我們有太多高分低能的大模型。所以我們不單單要測評它是不是掌握了知識,還要去測評他是不是像人一樣能夠具備解決實際問題的能力。還需要去測評他是不是有足夠的智商,需要測評是不是有足夠的情商。你跟很多大模型講,“我去藥店買藥了”,現(xiàn)在很多大模型的回復是“祝你購物愉快”,這種情商很多人難以接受,但是如果你問GPT4你會發(fā)現(xiàn)還是不錯的。所以情商、智商評測也很重要。
一個大模型的行業(yè)落地路徑跟行業(yè)專家的演進路徑何其相像,一個醫(yī)生成為一個行業(yè)專家,首先要完成通識教育,現(xiàn)在的通用大模型就是幫我們完成通識階段的教育,然后要進入醫(yī)學院學習專業(yè)知識,這是專業(yè)大模型干的事兒,再進一步使用各種各樣的工具,這就是讓大模型變成Agent,然后能夠在實踐中獲得反饋,這就是他變成實習醫(yī)生了,再然后經(jīng)過實踐的反饋,獲得行業(yè)的洞察,形成敏銳的行業(yè)直覺,變成真正意義上的專家。所以大模型在千行百業(yè)的應用道路上本質就是利用大模型實現(xiàn)專家水平的認知智能的過程。
最后總結一下。我們推動大模型往行業(yè)千行百業(yè)應用的過程中,一定要合理定位、正確認識、場景多元、積極開辟新賽道,注重大模型的成本和價值,促進大模型和千行百業(yè)的深度融合,大模型絕不應該只停留在煉金術階段,我們要推動它變成科學,大模型必須跟行業(yè)深度融合才有可能真正的可持續(xù)發(fā)展。