《經(jīng)濟(jì)參考報(bào)》記者近日調(diào)研獲悉,,AI(人工智能)大模型相當(dāng)于“超級(jí)大腦”,,正成為人工智能“新高地”。AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),,給部分產(chǎn)業(yè)帶來重大變革,。我國(guó)有較大的AI大模型應(yīng)用市場(chǎng),但發(fā)展過程中面臨部分技術(shù)薄弱,、人才稀缺,、成本高昂等多重挑戰(zhàn),亟須對(duì)相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局加以引導(dǎo)和支持,。
趙乃育 繪
“學(xué)富五車”的“超級(jí)大腦”
——“不開心的話可以聽點(diǎn)開心的歌,,看看喜劇,也可以去運(yùn)動(dòng),,或者好好休息一下,。”
——“心情不好是一種很正常的情緒,,所以不用太過自責(zé),。”
針對(duì)“今天心情不好應(yīng)該怎么辦”這一問題,,一個(gè)人工智能平臺(tái)以不同的“人設(shè)”,,給出了不同的回答。通過網(wǎng)址鏈接進(jìn)入該平臺(tái),,在“人設(shè)問答”區(qū)隨機(jī)輸入問題,,機(jī)器可支持和扮演不同“人設(shè)”,對(duì)問題給出多角度答案,。該平臺(tái)正是基于AI大模型打造而成,。
創(chuàng)新工場(chǎng)首席科學(xué)家、北京瀾舟科技創(chuàng)始人周明介紹,,AI大模型也稱人工智能預(yù)訓(xùn)練模型,,將海量數(shù)據(jù)導(dǎo)入具有幾億量級(jí)甚至十萬億量級(jí)參數(shù)的模型中,機(jī)器通過做類似“完形填空”等任務(wù),,深度學(xué)習(xí)數(shù)據(jù)中蘊(yùn)含的特征,、結(jié)構(gòu),最終被訓(xùn)練成具有邏輯推理和分析能力的人工智能,。
通俗地說,,AI大模型相當(dāng)于做了無數(shù)套關(guān)于各領(lǐng)域知識(shí)練習(xí)題、模擬題的“超級(jí)大腦”,,深諳各領(lǐng)域知識(shí)內(nèi)在邏輯和解題思路,,既能理解人類世界的知識(shí)體系,也可能產(chǎn)出新的知識(shí),。
2018年起,,人工智能進(jìn)入“大模型時(shí)代”,由重復(fù)開發(fā),、手工作坊式人工智能,,即“一千個(gè)應(yīng)用場(chǎng)景就有一千個(gè)小模型”的零散,、低效局面,走向工業(yè)化,、集成化智能的全新路徑,,以一個(gè)大模型“走天下”,為通用人工智能帶來曙光,。比如,,為生產(chǎn)智能音響,各個(gè)品牌競(jìng)相開發(fā)各自的AI小模型,,未來各品牌只需在同一個(gè)AI大模型基礎(chǔ)上開發(fā)即可,。
“以前是‘碎片化’的人工智能,針對(duì)不同的應(yīng)用場(chǎng)景要開發(fā)不同的模型,。作坊式開發(fā)對(duì)資源,、成本造成較大消耗,且效率低下,。未來在各垂直領(lǐng)域落地時(shí),,只需基于一個(gè)大模型,對(duì)其參數(shù)進(jìn)行微調(diào)即可,,這樣就打造出了具有通用性質(zhì)的人工智能,。”華為云人工智能領(lǐng)域首席科學(xué)家,、國(guó)際歐亞科學(xué)院院士田奇介紹,,AI大模型將重新定義人工智能產(chǎn)業(yè)模式、產(chǎn)業(yè)標(biāo)準(zhǔn),,甚至產(chǎn)業(yè)倫理,。
受訪者舉例介紹,以前的小模型就像“偏科的機(jī)器”,,只學(xué)習(xí)針對(duì)特定應(yīng)用場(chǎng)景的有限數(shù)據(jù),,“舉一反三”能力不足,一些智能產(chǎn)品被用戶調(diào)侃為“人工智障”的情況時(shí)有發(fā)生,。而AI大模型則學(xué)習(xí)了各行各業(yè)各類數(shù)據(jù),,成為具備良好的知識(shí)遷移能力的“通才”,適用領(lǐng)域更廣,,產(chǎn)出內(nèi)容質(zhì)量更高,更加智能,。
同時(shí),,周明指出,大模型的發(fā)展并非一味追求參數(shù)量大,,而是聚焦模型的高性能,,“在讓大模型學(xué)習(xí)和掌握更大量數(shù)據(jù)的同時(shí),,盡可能讓大模型參數(shù)相對(duì)輕量化,在‘減負(fù)’的同時(shí)提高能效,?!?/p>
可分飾多角 應(yīng)用場(chǎng)景廣泛
自動(dòng)問診、產(chǎn)品營(yíng)銷,、小說續(xù)寫……由于懂得人類語言,,且具備細(xì)分行業(yè)專業(yè)知識(shí),一個(gè)AI大模型可分飾多角,,它做得了醫(yī)生,,當(dāng)?shù)昧俗骷遥瑒偃蔚昧饲楦胁┲?,從事得了電商客服…?/p>
AI大模型行業(yè)適用范圍廣,,在醫(yī)療、金融,、零售,、氣象、新聞傳播,、文學(xué)藝術(shù)等領(lǐng)域具有廣泛應(yīng)用場(chǎng)景,。周明介紹,在大模型中輸入關(guān)鍵詞,、主題,、文本風(fēng)格等控制屬性后,即可生成滿足約束條件的文本內(nèi)容,,可用于產(chǎn)品營(yíng)銷文案寫作,、電商智能客服等。在金融等領(lǐng)域,,大模型通過抓取行業(yè)數(shù)據(jù),,自主完成篩選、分析,,并自主撰寫生成行業(yè)報(bào)告,,輔助從業(yè)人員做決策。
田奇介紹,,AI大模型已應(yīng)用于國(guó)網(wǎng)電力部門的日常線路檢測(cè),。“以前要識(shí)別各種電力傳輸線上的缺陷,,需要針對(duì)每一類缺陷單獨(dú)做一個(gè)小模型,,有幾百種缺陷就要做幾百種模型,現(xiàn)在利用一個(gè)大模型就可完成各類缺陷的識(shí)別?!?/p>
值得注意的是,,AI大模型目前的技術(shù)進(jìn)步,是人工智能從感知向認(rèn)知演進(jìn)的關(guān)鍵環(huán)節(jié),。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)表示,,古今中外一切文章、資料,,都可作為訓(xùn)練大模型的數(shù)據(jù),。通過分析并“內(nèi)化”海量知識(shí),不僅讓智能產(chǎn)品擁有更高性能,,如機(jī)器翻譯更加準(zhǔn)確,、機(jī)器寫作更加生動(dòng)有邏輯;還能品讀人類情感,,用于情感標(biāo)注,。此外,“它可能識(shí)別到‘弦外之音’,,甚至有希望發(fā)現(xiàn)人類未曾掌握的知識(shí),。”
這一技術(shù)的發(fā)展,,也可能給部分產(chǎn)業(yè)帶來重大變革,。周明說,未來將產(chǎn)生新一代搜索引擎,?!澳壳按蟛糠炙阉饕媸腔陉P(guān)鍵詞識(shí)別,只將庫里已有的包含關(guān)鍵詞的結(jié)果‘搬運(yùn)’給用戶,,而基于大模型的新一代搜索引擎,,通過理解人類語言,可以自主生成回答,,且支持文字,、圖片、音頻,、視頻等多模態(tài)搜索,。”
田奇表示,,新一代搜索引擎具備創(chuàng)作能力,,比如搜索“長(zhǎng)翅膀的貓”“會(huì)飛的豬”等現(xiàn)實(shí)中不存在的事物,搜索引擎也可根據(jù)描述生成相應(yīng)照片,。
多重發(fā)展難題待解
當(dāng)前,,美國(guó)OpenAI、谷歌、微軟,、臉書、英偉達(dá)等海外公司紛紛布局AI大模型產(chǎn)業(yè),,國(guó)內(nèi)的華為,、阿里巴巴、百度等大型企業(yè),,以及高校,、科研機(jī)構(gòu)也加入研發(fā)賽道。AI大模型正成為人工智能“新高地”,。
記者調(diào)研了解到,,從技術(shù)上講,國(guó)內(nèi)AI大模型已初步成熟,,下一步將聚焦行業(yè)推廣,,并結(jié)合具體問題對(duì)模型進(jìn)行迭代。田奇預(yù)測(cè),,AI大模型的大規(guī)模應(yīng)用“可能還需要兩到三年時(shí)間”,,且未來AI大模型還有望集納于芯片上,更方便落地應(yīng)用,。
專家指出,,我國(guó)有較大的AI大模型應(yīng)用市場(chǎng),在應(yīng)用領(lǐng)域具有優(yōu)勢(shì),,但發(fā)展過程中也面臨一些挑戰(zhàn),。
劉知遠(yuǎn)介紹,很多核心技術(shù)目前仍然掌握在發(fā)達(dá)國(guó)家手中,,訓(xùn)練AI大模型需大量GPU(圖形處理器)芯片,,但當(dāng)前國(guó)產(chǎn)GPU芯片技術(shù)相對(duì)薄弱。同時(shí),,我國(guó)在算法上的原始創(chuàng)新能力也有待提升,。
多位受訪者表示,目前從事AI大模型研發(fā)且能產(chǎn)出創(chuàng)新性成果的高校,、科研機(jī)構(gòu)和企業(yè)屈指可數(shù),,與國(guó)外相比,我國(guó)相關(guān)領(lǐng)域高水平基礎(chǔ)人才培養(yǎng)力度有待加強(qiáng),。
此外,,訓(xùn)練大模型需要較高的電力成本、設(shè)備成本等,,很多中小企業(yè),、科研單位囿于高昂成本,無法搭建擁有充足算力的機(jī)房,面臨算力不足的問題,。
多措并舉搶占“新高地”
多位專家表示,,AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,將更高效地賦能AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,。相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局引導(dǎo),、配套支持政策、合理監(jiān)管等舉措能否有效落地至關(guān)重要,。
首先,,推進(jìn)AI大模型標(biāo)準(zhǔn)化。受訪專家指出,,大模型的訓(xùn)練過程具有高能耗的特點(diǎn),,制定標(biāo)準(zhǔn)后,許多工作可基于已經(jīng)開發(fā)的標(biāo)準(zhǔn)化大模型進(jìn)行適配和二次開發(fā),,無需每次從頭訓(xùn)練,,以降低能耗。同時(shí),,大模型發(fā)展的過程中,,也可能衍生違法違規(guī)信息生成、隱私泄露,、虛假信息傳播等風(fēng)險(xiǎn),,對(duì)用于訓(xùn)練模型的源頭數(shù)據(jù)等做好規(guī)范,有利于規(guī)避相關(guān)風(fēng)險(xiǎn),。國(guó)家相關(guān)部門可牽頭或引導(dǎo)企業(yè),、研究所、高校等共同定義大模型的標(biāo)準(zhǔn),。
其次,,適當(dāng)開放訓(xùn)練數(shù)據(jù)。受訪者表示,,訓(xùn)練大模型需要海量數(shù)據(jù),,出于對(duì)數(shù)據(jù)的隱私、安全等方面的擔(dān)憂,,一些領(lǐng)域難以獲取數(shù)據(jù),,形成數(shù)據(jù)孤島。建議在國(guó)家機(jī)構(gòu)監(jiān)管和宏觀把控的前提下,,各方數(shù)據(jù)能夠?qū)Π酌麊纹髽I(yè),、機(jī)構(gòu)、高校適當(dāng)開放,,在確保數(shù)據(jù)安全使用的同時(shí),,增強(qiáng)我國(guó)AI大模型實(shí)力,。例如,醫(yī)院等機(jī)構(gòu)適當(dāng)開放數(shù)據(jù),,將有利于訓(xùn)練更懂醫(yī)療的大模型,,賦能健康醫(yī)藥領(lǐng)域發(fā)展。
再次,,鼓勵(lì)算力共享,。記者調(diào)研了解到,目前只有部分大企業(yè)能夠負(fù)擔(dān)超大模型訓(xùn)練所需的算力成本,。受訪專家呼吁,可引導(dǎo)具有強(qiáng)算力的人工智能“國(guó)家隊(duì)”,,為更多中小微企業(yè),、科研單位提供大模型訓(xùn)練所需的算力支撐,可探索合理付費(fèi)的算力共享機(jī)制,,共同促進(jìn)技術(shù)的發(fā)展和資源的節(jié)約,。
最后,加大原始創(chuàng)新引導(dǎo)和支持,。多位專家指出,,我國(guó)應(yīng)加強(qiáng)研發(fā)力度,同時(shí)加強(qiáng)針對(duì)模型框架的基礎(chǔ)創(chuàng)新研究,,引導(dǎo)更多科研單位,、高校積極培養(yǎng)相關(guān)人才,鼓勵(lì)更多社會(huì)力量加入這場(chǎng)信息革命的浪潮,。
?
AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),,給部分產(chǎn)業(yè)帶來重大變革。
經(jīng)濟(jì)參考報(bào)社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟(jì)參考報(bào)協(xié)議授權(quán),,禁止轉(zhuǎn)載使用
新聞線索提供熱線:010-63074375 63072334 報(bào)社地址:北京市宣武門西大街57號(hào)
JJCKB.CN 京ICP備18039543號(hào)