您的位置: 首頁 > 推薦

百度大模型上新 智能體仍有差距

出處:北京商報(bào) 作者: 魏蔚 網(wǎng)編:王巍 2024-11-12

“應(yīng)用來了”,百度世界大會(huì)2024年的主題簡單明了,11月12日,百度CEO李彥宏一上場也緊扣主題,“這代表了百度對(duì)當(dāng)前大模型和生成式人工智能時(shí)代的認(rèn)知和判斷”,并從智能體和產(chǎn)業(yè)應(yīng)用兩個(gè)方向“上新”:可以直播的角色類智能體、可以將照片變成動(dòng)畫的工具類智能體等。

大模型是新的革命還是新的泡沫?李彥宏認(rèn)為百度有資格回答這個(gè)問題,截至11月12日文心大模型日均調(diào)用量超15億,他也承認(rèn)眾所期待的AI超級(jí)應(yīng)用還沒有出現(xiàn)。“PC時(shí)代的應(yīng)用是軟件和網(wǎng)站,移動(dòng)時(shí)代是App,大模型時(shí)代是智能體。”李彥宏強(qiáng)調(diào),“智能體是AI應(yīng)用的最主流形態(tài),即將迎來它的爆發(fā)點(diǎn)。”

圖片來源:企業(yè)供圖

基本解決幻覺問題

“要想基于大模型開發(fā)應(yīng)用,消除幻覺是必須的。”李彥宏一針見血,“如果這個(gè)模型總是一本正經(jīng)地胡說八道,就不會(huì)有人信你,就不會(huì)有應(yīng)用。”

其實(shí),在大模型爆發(fā)的兩年里,幻覺現(xiàn)象在不同使用場景下的改善程度也不一樣。

在李彥宏看來,“大模型是一個(gè)概率模型,生成的內(nèi)容具有不確定性。采用RAG(檢索增強(qiáng)生成)技術(shù)后,大模型會(huì)利用檢索到的信息來指導(dǎo)文本或答案的生成,提高內(nèi)容的質(zhì)量和準(zhǔn)確性。文字層面的RAG已經(jīng)做得很好了,但圖像等多模態(tài)內(nèi)容和RAG的結(jié)合還不夠”。

他拿兩張?zhí)靿膱D片舉例,大模型生成的天壇是四層的,真正的天壇其實(shí)只有三層,這就是典型的文生圖幻覺現(xiàn)象?;氐綉?yīng)用層面,這種幻覺現(xiàn)象目前仍然很普遍,“所以今天的多模態(tài)大模型,沒有什么成規(guī)模的應(yīng)用出來。就是幻覺沒有解決,至少?zèng)]有像文生文RAG解決得那么好”,李彥宏說。

基于此,百度開發(fā)了iRAG技術(shù),即檢索增強(qiáng)的文生圖技術(shù)。該技術(shù)將百度搜索的圖片資源跟基礎(chǔ)模型能力相結(jié)合,可以生成各種超真實(shí)的圖片。

百度CTO王海峰詳細(xì)介紹稱,“百度基于大模型對(duì)用戶的需求進(jìn)行分析理解,自動(dòng)規(guī)劃精準(zhǔn)或泛化方案;接著在增強(qiáng)階段,對(duì)需要增強(qiáng)的實(shí)體,檢索并選擇相應(yīng)的參考圖;最后在生成階段,自研了多??煽厣鷪D大模型。在實(shí)際應(yīng)用中,這個(gè)方法也支持用戶上傳參考圖,應(yīng)用戶期望進(jìn)行生成”。

一些立等可取的現(xiàn)貨

不論是熱門新能源汽車還是大模型,技術(shù)、應(yīng)用、商業(yè)模式都是漸進(jìn)的過程。就像中歐AI與管理創(chuàng)新研究中心秘書長錢文穎說的,“人工智能目前處于早期階段,更多是以實(shí)驗(yàn)室創(chuàng)新為主。隨著技術(shù)成熟,企業(yè)需要將這些創(chuàng)新應(yīng)用到實(shí)際場景中,滿足實(shí)際需求,逐步實(shí)現(xiàn)商業(yè)化”。

當(dāng)天,李彥宏就展示了iRAG的應(yīng)用場景:品牌宣傳。“試想一下,如果給大眾汽車生成的海報(bào),車型長得像豐田”,他開了個(gè)玩笑,“之前一組汽車海報(bào)拍攝需要一二十萬,甚至大幾十萬元,現(xiàn)在創(chuàng)作成本接近于0,iRAG的商業(yè)價(jià)值在于:無幻覺、超真實(shí)、沒成本、立等可取”。

55分鐘的演講中,他提到兩次“立等可取”這個(gè)詞,第二次是談到“自由畫布”時(shí),一個(gè)由百度文庫和百度網(wǎng)盤聯(lián)合開發(fā)的工具類智能體,核心功能體現(xiàn)在輸入、編輯、創(chuàng)作、分享環(huán)節(jié)。

以創(chuàng)作為例,在劃好重點(diǎn)后,用戶框選全部需要的素材就能一鍵生成,根據(jù)現(xiàn)場分享的視頻,輸入一張兒童的照片,加上故事的背景等,自由畫布就可以生成一個(gè)漫畫。

“自由畫布可以幫你完成從找資料到編輯,再到生成和分享的全部任務(wù)。每個(gè)人都可以成為漫畫家、短視頻導(dǎo)演。”說到這兒,李彥宏的聲音明顯提高,“這不是期貨,是立即可用的現(xiàn)貨”。

和自由畫布一樣零門檻的還有無代碼工具“秒噠”,一個(gè)多智能體協(xié)作工具。以設(shè)計(jì)一個(gè)蘿卜快跑新技術(shù)發(fā)布會(huì)的邀請(qǐng)函為例,包括海報(bào)生成、文案生成、嘉賓報(bào)名、地圖信息展示等,工作人員不需要懂代碼就可以完成,用李彥宏的話說,“你不需要去招募項(xiàng)目經(jīng)理、設(shè)計(jì)人員、開發(fā)人員、測(cè)試人員等,自己就可以指揮多個(gè)智能體來協(xié)同完成任務(wù)”。

應(yīng)用的樣貌不一樣

一個(gè)是智能體,一個(gè)是智能體協(xié)作工具,李彥宏看好的智能體在百度世界大會(huì)2024官宣前、預(yù)熱時(shí)、主論壇演講和展區(qū)都出現(xiàn)在C位。

北京商報(bào)記者體驗(yàn)了展區(qū)的農(nóng)民院士智能體。“你好,我是農(nóng)民院士朱有勇的智能體,你可以通過向我提問,了解旱地優(yōu)質(zhì)稻的具體問題解答。”“院士”有問必答。截至記者發(fā)稿,這款智能體在文心智能體平臺(tái)上的瀏覽次數(shù)11.3萬次,幫助2.9萬人。整個(gè)文心智能體平臺(tái)上,已吸引15萬家企業(yè)和80萬名開發(fā)者參與。

11月12日當(dāng)天,李彥宏大部分時(shí)間也在給智能體打call,他將百度的智能體分為四類:公司類智能體、角色類智能體、工具類智能體、行業(yè)類智能體。

“智能體是AI應(yīng)用的最主流形態(tài),即將迎來它的爆發(fā)點(diǎn)”,他再一次強(qiáng)調(diào),“未來公司官方智能體很可能替代官網(wǎng)”,并從PC時(shí)代追溯至今,“在人類信息技術(shù)變革的不同歷史時(shí)期,應(yīng)用出現(xiàn)的樣貌也不一樣:在PC時(shí)期,它是一個(gè)個(gè)的軟件和網(wǎng)站;在移動(dòng)時(shí)期,它是一個(gè)個(gè)的App和可被關(guān)注的賬號(hào);在AI時(shí)代,應(yīng)用主要的形態(tài)就是智能體”。

應(yīng)用、智能體為什么屢次被提及?換一個(gè)角度或許更容易理解,“正常健康的生態(tài)應(yīng)用是:應(yīng)用創(chuàng)造的價(jià)值)云廠商)芯片GPU(圖形處理器)”,零一萬物創(chuàng)始人及CEO李開復(fù)說。

北京商報(bào)記者 魏蔚

圖片來源:企業(yè)供圖

右側(cè)廣告
新聞排行

本網(wǎng)站所有內(nèi)容屬北京商報(bào)社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報(bào)總機(jī):010-64101978 媒體合作:010-64101871

商報(bào)地址:北京市朝陽區(qū)和平里西街21號(hào) 郵編:100013 法律顧問:北京市中同律師事務(wù)所(010-82011988)

網(wǎng)上有害信息舉報(bào)  違法和不良信息舉報(bào)電話:010-84276691 舉報(bào)郵箱:bjsb@bbtnews.com.cn

ICP備案編號(hào):京ICP備08003726號(hào)-1  京公網(wǎng)安備11010502045556號(hào)  互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號(hào)