2024世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2024)7月4日在上海開幕,。上海人工智能實(shí)驗(yàn)室(簡稱“上海AI實(shí)驗(yàn)室”)主任,、清華大學(xué)惠妍講席教授周伯文在會議上提出“探索人工智能45°平衡律”的技術(shù)主張。
周伯文指出,,當(dāng)前,,以大模型為代表的生成式人工智能快速發(fā)展,,但隨著能力的不斷提升,模型自身及其應(yīng)用也帶來了一系列潛在風(fēng)險的顧慮,。
從公眾對AI風(fēng)險的關(guān)注程度來看,,首先是數(shù)據(jù)泄露、濫用,、隱私及版權(quán)相關(guān)的內(nèi)容風(fēng)險,,其次是惡意使用帶來偽造、虛假信息等相關(guān)的使用風(fēng)險,,當(dāng)然也誘發(fā)了偏見歧視等倫理相關(guān)問題,,此外還有人擔(dān)心人工智能是否會對就業(yè)結(jié)構(gòu)等社會系統(tǒng)性問題帶來挑戰(zhàn)。在一系列關(guān)于人工智能的科幻電影中,,甚至出現(xiàn)了AI失控,、人類喪失自主權(quán)等設(shè)定。
在周伯文看來,這些由AI帶來的風(fēng)險已初露端倪,,但更多的是潛在風(fēng)險,,防范這些風(fēng)險需要各界共同努力,需要科學(xué)社區(qū)做出更多貢獻(xiàn),。對此,,他表示,“可信AGI(人工通用智能)需要能夠兼顧安全與性能,,我們需要找到AI安全優(yōu)先,,但又能保證AI性能長期發(fā)展的技術(shù)體系。我們把這樣一種技術(shù)思想體系叫做‘AI-45°平衡律’(AI-45°Law),?!?/p>
據(jù)介紹,AI-45°平衡律是指從長期的角度來看,,AGI要大體上沿著45度安全與性能平衡發(fā)展,,平衡是指短期可以有波動,但不能長期低于45°(如同現(xiàn)在),,也不能長期高于45度(這將阻礙發(fā)展與產(chǎn)業(yè)應(yīng)用),。這個技術(shù)思想體系要求強(qiáng)技術(shù)驅(qū)動、全流程優(yōu)化,、多主體參與以及敏捷治理,。
實(shí)現(xiàn)AI-45°平衡律也許有多種技術(shù)路徑。周伯文表示,,上海AI實(shí)驗(yàn)室最近在探索一條以因果為核心的路徑,,并取名為:可信AGI的“因果之梯”,致敬因果推理領(lǐng)域的先驅(qū)——圖靈獎得主Judea Pearl,。
可信AGI的“因果之梯”將可信AGI的發(fā)展分為三個遞進(jìn)階段:泛對齊,、可干預(yù)、能反思,。“泛對齊”主要包含當(dāng)前最前沿的人類偏好對齊技術(shù),。但需要注意的是,,這些安全對齊技術(shù)僅依賴統(tǒng)計(jì)相關(guān)性而忽視真正的因果關(guān)系,可能導(dǎo)致錯誤推理和潛在危險,?!翱筛深A(yù)”主要包含通過對AI系統(tǒng)進(jìn)行干預(yù),探究其因果機(jī)制的安全技術(shù),,通過提高可解釋性和泛化性來提升安全性,,同時也能提升AI能力。“能反思”則要求AI系統(tǒng)不僅追求高效執(zhí)行任務(wù),,還能審視自身行為的影響和潛在風(fēng)險,,從而在追求性能的同時,確保安全和道德邊界不被突破,。
周伯文表示,,“正如可控核聚變對全人類都是共同利益一樣,我們堅(jiān)信AI的安全也是全球性的公共福祉,,愿與大家一起攜手推進(jìn)AI-45°平衡律的發(fā)展,,共享AI安全技術(shù)、加強(qiáng)全球AI安全人才交流與合作,,平衡AI安全與能力的投入,,共同構(gòu)建開放、安全的通用人工智能創(chuàng)新生態(tài)和人才發(fā)展環(huán)境,?!?/p>
近日,,黑龍江省大田作物正值夏管階段,,黑土地上一片忙碌景象。
《經(jīng)濟(jì)參考報》社有限責(zé)任公司版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)協(xié)議授權(quán),,禁止轉(zhuǎn)載使用
新聞線索提供熱線:010-63074375 63072334 報社地址:北京市宣武門西大街57號
JJCKB.CN 京ICP備18039543號