《經(jīng)濟(jì)參考報(bào)》記者近日調(diào)研獲悉,AI(人工智能)大模型相當(dāng)于“超級大腦”,,正成為人工智能“新高地”,。AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),給部分產(chǎn)業(yè)帶來重大變革,。我國有較大的AI大模型應(yīng)用市場,,但發(fā)展過程中面臨部分技術(shù)薄弱、人才稀缺,、成本高昂等多重挑戰(zhàn),,亟須對相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局加以引導(dǎo)和支持。
趙乃育 繪
“學(xué)富五車”的“超級大腦”
——“不開心的話可以聽點(diǎn)開心的歌,,看看喜劇,,也可以去運(yùn)動,或者好好休息一下,?!?/p>
——“心情不好是一種很正常的情緒,所以不用太過自責(zé),?!?/p>
針對“今天心情不好應(yīng)該怎么辦”這一問題,一個人工智能平臺以不同的“人設(shè)”,,給出了不同的回答,。通過網(wǎng)址鏈接進(jìn)入該平臺,在“人設(shè)問答”區(qū)隨機(jī)輸入問題,,機(jī)器可支持和扮演不同“人設(shè)”,,對問題給出多角度答案。該平臺正是基于AI大模型打造而成,。
創(chuàng)新工場首席科學(xué)家,、北京瀾舟科技創(chuàng)始人周明介紹,AI大模型也稱人工智能預(yù)訓(xùn)練模型,,將海量數(shù)據(jù)導(dǎo)入具有幾億量級甚至十萬億量級參數(shù)的模型中,,機(jī)器通過做類似“完形填空”等任務(wù),深度學(xué)習(xí)數(shù)據(jù)中蘊(yùn)含的特征,、結(jié)構(gòu),,最終被訓(xùn)練成具有邏輯推理和分析能力的人工智能。
通俗地說,,AI大模型相當(dāng)于做了無數(shù)套關(guān)于各領(lǐng)域知識練習(xí)題,、模擬題的“超級大腦”,,深諳各領(lǐng)域知識內(nèi)在邏輯和解題思路,既能理解人類世界的知識體系,,也可能產(chǎn)出新的知識,。
2018年起,人工智能進(jìn)入“大模型時代”,,由重復(fù)開發(fā),、手工作坊式人工智能,即“一千個應(yīng)用場景就有一千個小模型”的零散,、低效局面,,走向工業(yè)化、集成化智能的全新路徑,,以一個大模型“走天下”,,為通用人工智能帶來曙光。比如,,為生產(chǎn)智能音響,,各個品牌競相開發(fā)各自的AI小模型,未來各品牌只需在同一個AI大模型基礎(chǔ)上開發(fā)即可,。
“以前是‘碎片化’的人工智能,,針對不同的應(yīng)用場景要開發(fā)不同的模型。作坊式開發(fā)對資源,、成本造成較大消耗,,且效率低下。未來在各垂直領(lǐng)域落地時,,只需基于一個大模型,,對其參數(shù)進(jìn)行微調(diào)即可,這樣就打造出了具有通用性質(zhì)的人工智能,?!比A為云人工智能領(lǐng)域首席科學(xué)家、國際歐亞科學(xué)院院士田奇介紹,,AI大模型將重新定義人工智能產(chǎn)業(yè)模式,、產(chǎn)業(yè)標(biāo)準(zhǔn),甚至產(chǎn)業(yè)倫理,。
受訪者舉例介紹,,以前的小模型就像“偏科的機(jī)器”,只學(xué)習(xí)針對特定應(yīng)用場景的有限數(shù)據(jù),,“舉一反三”能力不足,,一些智能產(chǎn)品被用戶調(diào)侃為“人工智障”的情況時有發(fā)生。而AI大模型則學(xué)習(xí)了各行各業(yè)各類數(shù)據(jù),,成為具備良好的知識遷移能力的“通才”,,適用領(lǐng)域更廣,,產(chǎn)出內(nèi)容質(zhì)量更高,更加智能,。
同時,,周明指出,大模型的發(fā)展并非一味追求參數(shù)量大,,而是聚焦模型的高性能,,“在讓大模型學(xué)習(xí)和掌握更大量數(shù)據(jù)的同時,盡可能讓大模型參數(shù)相對輕量化,,在‘減負(fù)’的同時提高能效,?!?/p>
可分飾多角 應(yīng)用場景廣泛
自動問診,、產(chǎn)品營銷、小說續(xù)寫……由于懂得人類語言,,且具備細(xì)分行業(yè)專業(yè)知識,,一個AI大模型可分飾多角,它做得了醫(yī)生,,當(dāng)?shù)昧俗骷?,勝任得了情感博主,從事得了電商客服…?/p>
AI大模型行業(yè)適用范圍廣,,在醫(yī)療,、金融、零售,、氣象,、新聞傳播、文學(xué)藝術(shù)等領(lǐng)域具有廣泛應(yīng)用場景,。周明介紹,,在大模型中輸入關(guān)鍵詞、主題,、文本風(fēng)格等控制屬性后,,即可生成滿足約束條件的文本內(nèi)容,可用于產(chǎn)品營銷文案寫作,、電商智能客服等,。在金融等領(lǐng)域,大模型通過抓取行業(yè)數(shù)據(jù),,自主完成篩選,、分析,并自主撰寫生成行業(yè)報(bào)告,,輔助從業(yè)人員做決策,。
田奇介紹,,AI大模型已應(yīng)用于國網(wǎng)電力部門的日常線路檢測?!耙郧耙R別各種電力傳輸線上的缺陷,,需要針對每一類缺陷單獨(dú)做一個小模型,有幾百種缺陷就要做幾百種模型,,現(xiàn)在利用一個大模型就可完成各類缺陷的識別,。”
值得注意的是,,AI大模型目前的技術(shù)進(jìn)步,,是人工智能從感知向認(rèn)知演進(jìn)的關(guān)鍵環(huán)節(jié)。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)表示,,古今中外一切文章,、資料,都可作為訓(xùn)練大模型的數(shù)據(jù),。通過分析并“內(nèi)化”海量知識,,不僅讓智能產(chǎn)品擁有更高性能,如機(jī)器翻譯更加準(zhǔn)確,、機(jī)器寫作更加生動有邏輯,;還能品讀人類情感,用于情感標(biāo)注,。此外,,“它可能識別到‘弦外之音’,甚至有希望發(fā)現(xiàn)人類未曾掌握的知識,?!?/p>
這一技術(shù)的發(fā)展,也可能給部分產(chǎn)業(yè)帶來重大變革,。周明說,,未來將產(chǎn)生新一代搜索引擎?!澳壳按蟛糠炙阉饕媸腔陉P(guān)鍵詞識別,,只將庫里已有的包含關(guān)鍵詞的結(jié)果‘搬運(yùn)’給用戶,而基于大模型的新一代搜索引擎,,通過理解人類語言,,可以自主生成回答,且支持文字,、圖片,、音頻、視頻等多模態(tài)搜索?!?/p>
田奇表示,,新一代搜索引擎具備創(chuàng)作能力,比如搜索“長翅膀的貓”“會飛的豬”等現(xiàn)實(shí)中不存在的事物,,搜索引擎也可根據(jù)描述生成相應(yīng)照片,。
多重發(fā)展難題待解
當(dāng)前,美國OpenAI,、谷歌,、微軟、臉書,、英偉達(dá)等海外公司紛紛布局AI大模型產(chǎn)業(yè),,國內(nèi)的華為、阿里巴巴,、百度等大型企業(yè),,以及高校、科研機(jī)構(gòu)也加入研發(fā)賽道,。AI大模型正成為人工智能“新高地”,。
記者調(diào)研了解到,,從技術(shù)上講,,國內(nèi)AI大模型已初步成熟,下一步將聚焦行業(yè)推廣,,并結(jié)合具體問題對模型進(jìn)行迭代,。田奇預(yù)測,AI大模型的大規(guī)模應(yīng)用“可能還需要兩到三年時間”,,且未來AI大模型還有望集納于芯片上,,更方便落地應(yīng)用。
專家指出,,我國有較大的AI大模型應(yīng)用市場,,在應(yīng)用領(lǐng)域具有優(yōu)勢,但發(fā)展過程中也面臨一些挑戰(zhàn),。
劉知遠(yuǎn)介紹,,很多核心技術(shù)目前仍然掌握在發(fā)達(dá)國家手中,訓(xùn)練AI大模型需大量GPU(圖形處理器)芯片,,但當(dāng)前國產(chǎn)GPU芯片技術(shù)相對薄弱,。同時,我國在算法上的原始創(chuàng)新能力也有待提升,。
多位受訪者表示,,目前從事AI大模型研發(fā)且能產(chǎn)出創(chuàng)新性成果的高校、科研機(jī)構(gòu)和企業(yè)屈指可數(shù),,與國外相比,,我國相關(guān)領(lǐng)域高水平基礎(chǔ)人才培養(yǎng)力度有待加強(qiáng),。
此外,訓(xùn)練大模型需要較高的電力成本,、設(shè)備成本等,,很多中小企業(yè)、科研單位囿于高昂成本,,無法搭建擁有充足算力的機(jī)房,,面臨算力不足的問題。
多措并舉搶占“新高地”
多位專家表示,,AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,,將更高效地賦能AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化。相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局引導(dǎo),、配套支持政策,、合理監(jiān)管等舉措能否有效落地至關(guān)重要。
首先,,推進(jìn)AI大模型標(biāo)準(zhǔn)化,。受訪專家指出,大模型的訓(xùn)練過程具有高能耗的特點(diǎn),,制定標(biāo)準(zhǔn)后,,許多工作可基于已經(jīng)開發(fā)的標(biāo)準(zhǔn)化大模型進(jìn)行適配和二次開發(fā),無需每次從頭訓(xùn)練,,以降低能耗,。同時,大模型發(fā)展的過程中,,也可能衍生違法違規(guī)信息生成,、隱私泄露、虛假信息傳播等風(fēng)險(xiǎn),,對用于訓(xùn)練模型的源頭數(shù)據(jù)等做好規(guī)范,,有利于規(guī)避相關(guān)風(fēng)險(xiǎn)。國家相關(guān)部門可牽頭或引導(dǎo)企業(yè),、研究所,、高校等共同定義大模型的標(biāo)準(zhǔn)。
其次,,適當(dāng)開放訓(xùn)練數(shù)據(jù),。受訪者表示,訓(xùn)練大模型需要海量數(shù)據(jù),,出于對數(shù)據(jù)的隱私,、安全等方面的擔(dān)憂,一些領(lǐng)域難以獲取數(shù)據(jù),形成數(shù)據(jù)孤島,。建議在國家機(jī)構(gòu)監(jiān)管和宏觀把控的前提下,,各方數(shù)據(jù)能夠?qū)Π酌麊纹髽I(yè)、機(jī)構(gòu),、高校適當(dāng)開放,,在確保數(shù)據(jù)安全使用的同時,增強(qiáng)我國AI大模型實(shí)力,。例如,,醫(yī)院等機(jī)構(gòu)適當(dāng)開放數(shù)據(jù),將有利于訓(xùn)練更懂醫(yī)療的大模型,,賦能健康醫(yī)藥領(lǐng)域發(fā)展,。
再次,鼓勵算力共享,。記者調(diào)研了解到,,目前只有部分大企業(yè)能夠負(fù)擔(dān)超大模型訓(xùn)練所需的算力成本。受訪專家呼吁,,可引導(dǎo)具有強(qiáng)算力的人工智能“國家隊(duì)”,,為更多中小微企業(yè)、科研單位提供大模型訓(xùn)練所需的算力支撐,,可探索合理付費(fèi)的算力共享機(jī)制,,共同促進(jìn)技術(shù)的發(fā)展和資源的節(jié)約。
最后,,加大原始創(chuàng)新引導(dǎo)和支持,。多位專家指出,我國應(yīng)加強(qiáng)研發(fā)力度,,同時加強(qiáng)針對模型框架的基礎(chǔ)創(chuàng)新研究,引導(dǎo)更多科研單位,、高校積極培養(yǎng)相關(guān)人才,,鼓勵更多社會力量加入這場信息革命的浪潮。
?
![]() |
AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),給部分產(chǎn)業(yè)帶來重大變革,。
經(jīng)濟(jì)參考報(bào)社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟(jì)參考報(bào)協(xié)議授權(quán),,禁止轉(zhuǎn)載使用
新聞線索提供熱線:010-63074375 63072334 報(bào)社地址:北京市宣武門西大街57號
JJCKB.CN 京ICP備18039543號