韩国大尺度《偷欢2》了,韩国禁欲系高级感电影,韩国动漫免费漫画好看,韩国《少妇的激情》,免费韩国高清理伦片A片,韩国《少妇的滋味》电影

X

掃碼登錄

二維碼
  • 賬號登錄
登錄
登錄視為您已同意第三方賬號綁定協議、服務條款、隱私政策
X

掃碼注冊

二維碼
  • 賬號注冊
我以閱讀并同意 服務條款、 隱私政策
注冊
注冊視為您已同意第三方賬號綁定協議、服務條款、隱私政策
首頁 > 新聞資訊 > 正文

大模型不能只會開放閑聊——專訪上海市數據科學重點實驗室主任肖仰華

2023年10月30日 17:03
行業資訊 瀏覽:504

中國市場巨大、數據豐富、應用場景豐富,完全可以用完善的應用生態來帶動底座大模型的進步,走一條“農村包圍城市”的路線。


《瞭望東方周刊》記者萬宏蕾?編輯顧佳贇

7月7日,華為技術有限公司在華為開發者大會2023上正式發布人工智能(AI)大模型華為云盤古大模型 3.0 ( 陳宇軒/攝 )

自ChatGPT上線來,國際國內各大廠商紛紛跟進,投入了巨大研發資源來研發類似大模型。人工智能的發展,尤其到了通用人工智能階段,可謂熱點紛呈。

作為人工智能產業發展過程中的里程碑事件,ChatGPT代表通用人工智能技術的成熟,宣告人類社會技術進步有可能進入快速增長期,甚至一個指數發展期。在類ChatGPT大模型領域,中國尚處于起步階段,需做進一步戰略規劃并統籌發展。就相關問題,《瞭望東方周刊》近日專訪了上海市數據科學重點實驗室主任、復旦大學教授肖仰華,探討我國大模型產業的發展路徑。

肖仰華

知識底座

《瞭望東方周刊》:通用大模型一定程度上刷新了我們對人工智能領域的認知,如何理解它帶來的變革?或者說大模型有哪些能力?

肖仰華:大模型是人類文明所積累的海量知識容器,其所具備的通識能力,就是開放世界的理解能力。現在跟ChatGPT聊天,聊任何行業、學科的問題,它都能給出一個看起來不錯的答案,雖然其仍可能犯一些事實錯誤、一些邏輯錯誤,但基本不會太偏離問題主旨——比如問出生日期卻答出生地點。它還具備一定的“自知之明”能力,對于超出范圍或者倫理敏感的問題,會拒絕回答。大模型這種對人類開放世界的理解力,已達到甚至超越普通人的水平。傳統人工智能產品的“智障”問題已基本解決,這種開放世界的理解能力,對垂直領域(垂域)的認知非常關鍵,因為垂域應用是建立在通用大模型的通用認知能力基礎之上的。

大模型有組合創新能力。我們在指令學習階段讓它學了A任務、B任務,它以后有可能泛化出求解A+B任務的能力。這種組合泛化,以前做不到,今天能做到,通用大模型讓“舉一反三”成為可能。

大模型有忠實的指令理解和執行能力,尤其是超大模型。只要給它指令、要求、約束、規范、規則,它就一定能夠按照要求一步步完成任務。這本質上是一種情境化生成能力。我甚至認為,大模型智能本質就是情境化生成能力,因為大模型在提示越來越豐富時,生成的效果越來越好。

大模型有復雜任務的分解能力和規劃能力。現實中很多場景都是復雜任務,需要一步一步求解,先做什么,再做什么,按照順序進行合理編排,這就是規劃能力。

大模型還有強大的符號推理能力。以前人們只是把大模型當做知識容器來看待,只期望其提供需要的知識。但今天不得不承認大模型也一定程度上具備類似知識庫(知識圖譜)所具備的推理能力,比如常識推理、數值推理等能力,當然這方面能力還需要進一步提升。

《瞭望東方周刊》:為什么說單有通用大模型不足以解決行業領域很多問題,需要發展垂域大模型?

肖仰華:因為具有上述能力,通用大模型好比是一個寬廣的知識底座,但仍然缺乏專業知識的深度,缺乏專業領域復雜應用的長程推理能力。ChatGPT這類大模型本質上只是實現了在開放環境下的人機對話,或者叫開放閑聊,但開放閑聊并不能幫我們解決實實在在的工作場景中的復雜決策任務,比如要做設備故障排查、疾病診斷,都是嚴肅復雜的決策場景。在這些場景中需要豐富的專業知識、復雜的決策邏輯、宏觀態勢的研判能力、綜合任務的拆解與規劃能力、復雜約束的取舍能力、未見事物的預見能力、不確定場景的推理推斷能力等。

大模型的開放閑聊過程中可能存在兩個問題:一是“幻覺”問題。與ChatGPT聊天,有時它說得頭頭是道,但仔細分析,會發現它正在胡編亂造一些不存在的事實。同時因為其語言風格一本正經,讓普通人很容易相信它,即便是領域專家要從它有板有眼的文本中識別虛構和錯誤也是一件不易的事。

二是缺乏領域“忠實度”的問題。解決任何專業領域的問題都要求大模型不要自己根據通識去自由發揮,而要嚴格遵循這個領域的規范、用符合這個領域的知識體系來回答問題。但是我們去嘗試了一些通用大模型,發現如果不做一些調教優化,它總是會超出你給定的領域文檔自由發揮,進而犯錯。

所以,一個基本的判斷是:單單利用現在的通用大模型不足以解決行業很多問題。實際應用需要的是事實正確、忠實于領域知識與文本的垂域大模型。從這個判斷出發,當下我們要發展面向垂域的大模型,要發展通用大模型的外圍插件,要采取大模型和知識圖譜、傳統知識庫相結合的策略。

趕上差距

《瞭望東方周刊》:面對ChatGPT所引發的通用人工智能產業變革,國內企業應該如何抓住大模型產業機會?

肖仰華:大模型絕不是宣傳文案的噱頭。我們正在見證由通用人工智能所帶來的前所未有的技術革命。通用人工智能是人類歷史上第一次關于智能本身的革命。歷次技術突破都是人類智能的產物,而唯獨通用人工智能是“智能”本身的革命。

大模型的誕生宣告了整個人工智能進入全新的重工業時代。回顧人類歷史上的歷次技術革命,多始于相對低級的手工作坊模式,經過漫長的發展周期,最終形成了成熟的重工業發展模式。重工業化的人工智能有三個鮮明的特征:大模型、大算力和大數據。

5月23日,工作人員在貴州大學省部共建公共大數據國家重點實驗室算力中心 ( 劉續/攝 )

國外大模型產業已經形成了一個生態,而且發展非常迅速。反觀國內,從表象上看熱鬧非凡、模型林立,但是剝開外殼從內里看,仍然有不少問題,不免讓人擔憂。

一方面,幾乎所有國內人工智能產業的重要企業與研發機構紛紛推出了自己的類ChatGPT大模型。這說明,大家都意識到大模型的戰略意義,積極主動投入資源,這值得肯定。

另一方面,國內大模型產業發展已經出現一些問題:一是技術路線同質化嚴重,很多大模型都是用ChatGPT喂養自己的大模型,或是在國外開源通用大模型基礎上進行指令微調;二是數據生態不完善,中文數據生態尤其重要,但現在較為欠缺;三是算力掣肘;四是模型創新有限,現在很多國內大模型都基于國外的開源社區模型。

總之,ChatGPT所引發的通用人工智能產業變革才剛剛開始,中國相關部門和企業要以深入的思考和扎實的實踐抓住機遇,同時高度重視發展過程中出現的問題。

《瞭望東方周刊》:具體來說,中國發展大模型產業目前面臨哪些短板?

肖仰華:大模型產業的發展取決于多個因素:其一是模型,模型好比內功,模型越大,潛力越強。其二是算力,這是大模型的核心競爭力,大模型競爭歸根結底是算力的競爭。其三是數據,只有高質量的數據,才能喂養出高水平的大模型。不過,這幾個問題都不是中國大模型產業的真正短板所在。

與國際同行相比,當前我國大模型產業發展在數據上有優勢,在算力方面有基礎,模型本身也不存在什么技術秘密,真正的短板在于我們對大模型“煉制”工藝的掌握,包括數據配方、數據清洗和參數設置等等,這些從根本上決定了大模型的效果,是大模型產業發展的重要因素。這方面短期之內難以跟上或者超越,需要我們付出巨大代價進行摸索。

實際上,上述的每一個具體模塊,國內都知道怎么做,但是將它們整合在一起,總體效果和國外是存在差距的,不是0分和100分的差距,而是70分與100分的差距。我們要趕上最后這幾十分,要不斷試錯、評測和改進。

從大模型問題引申來看,應用和集成創新,一直是我們的強項。但是跟美國相比,我們缺少原始創新,原始創新甚至到了極度稀缺的程度。原始創新是怎么來的?可能來自科學家的奇思妙想,可能來自偏執甚至瘋狂的想法。比如Open AI的CEO山姆·奧特曼(Sam Altman),他在2015年成立Open AI,2018年投入巨資研發大模型。而在2018年這個時間點,全世界沒有多少科學家認為通用大模型這條路可以走通。

將來我們要實現引領,就一定要不斷優化科研文化和科研生態,鼓勵思辨、鼓勵質疑,激發原始創新。

7月8日,2023世界人工智能大會在上海世博展覽館舉行。蜜度信息,“文稿通”基于大模型的詩歌生成

戰略定力

《瞭望東方周刊》:在大模型熱潮之下,中國自己的大模型發展道路究竟該怎么走?

肖仰華:國家有關部門要引導業界統一規劃、合作協同、有序發展、健康發展。對此,我建議,可以從八個方面的應對措施推動我國大模型產業的發展:一是積極推動數據聯盟(數據交易)的建設,促進優質數據的共享與傳播;二是大力推動算力聯盟建設,促進優質算力共享與協作;三是推動模型開源社區建設,完善國產大模型的開源生態;四是創新培養方式,培育大模型產業人才;五是建立大模型的診斷與應用評測體系,保障大模型產業健康發展;六是研究綠色可持續的大模型技術,降低大模型落地成本;七是積極探索大模型的應用模式,豐富大模型的應用場景;八是持續研究大模型訓練與應用關鍵技術,完善大模型技術體系。

尤其要注意,在這波大模型的發展熱潮之下,不能為了追隨ChatGPT,忽略了其他熱點,錯失了下一個機遇。我們一定要有戰略定力,對不斷出現的熱點要有戰略重視,但不能打亂既有部署。比如,很多傳統小模型,該研究還得繼續研究,數字化與智能化進程中的其他技術也得往前推進。

在方向上,或者說,只有底座大模型與垂域應用相結合,才能最終創造價值。比如,醫療領域希望做能代替或部分解放醫生的問診機器人,投資領域希望有投資顧問機器人,司法領域希望有法律咨詢機器人,這都屬于垂域場景。在提升通用大模型能力的同時,也期待相關企業能在大模型垂域應用上有所作為,把大模型的通識能力更好地與垂域的專業知識、專家經驗、行業解決問題的思維方式相結合,去解決現實中的復雜問題。我們既要重視通用大模型,更要重視垂域應用,重模型輕應用或者重應用輕模型,都是不可取的。

中國市場巨大、數據豐富、應用場景豐富,完全可以用完善的應用生態來帶動底座大模型的進步,走一條“農村包圍城市”的路線。也就說,先把我們擅長的外圍應用和技術生態做好,不斷去補齊通用大模型在數據、算力、模型和工藝等方面的短板,并在這一過程中摸索有中國特色的大模型發展道路,形成獨特優勢,另辟大模型競爭賽道,進而形成核心競爭力,形成百花齊放、百家爭鳴的繁榮生態。

總之,國產大模型絕不能停留在類ChatGPT的開放閑聊,要盡快提升其解決千行百業實際問題的能力,切實把大模型發展成為推動我國各行業數字化轉型與高質量發展的先進生產力。

暫無評論
頭像
0/1000
匿名
欢迎光临: 巴里| 新建县| 离岛区| 明水县| 清徐县| 新竹县| 辽阳市| 罗城| 错那县| 天峨县| 浪卡子县| 景洪市| 长丰县| 邹城市| 津市市| 桂东县| 平陆县| 宁城县| 玉门市| 商城县| 安陆市| 射洪县| 邛崃市| 镇赉县| 若羌县| 舞阳县| 威宁| 灵宝市| 锡林浩特市| 金沙县| 邳州市| 沙洋县| 岳普湖县| 通榆县| 涞水县| 平湖市| 鄂伦春自治旗| 璧山县| 高陵县| 潮安县| 镇江市|