如果說(shuō)2022年底的人工智能的熱潮是OpenAI的ChatGPT帶來(lái)的,那么2023年底,谷歌帶著它的Gemini高調(diào)殺回人工智能圈。過(guò)去近十年,谷歌一直把AI-first作為公司戰(zhàn)略,2016年打敗人類(lèi)圍棋冠軍的AlphaGo便是出自谷歌之手。曾經(jīng),是谷歌掀起的一股AI浪潮改變了整個(gè)AI行業(yè)的發(fā)展,但現(xiàn)在,它亟需在大模型領(lǐng)域證明自己。
多模態(tài)
當(dāng)?shù)貢r(shí)間12月6日,谷歌正式發(fā)布了Gemini大模型。谷歌CEO桑達(dá)爾·皮查伊 (Sundar Pichai) 稱(chēng),這是谷歌迄今為止“功能最強(qiáng)大、最通用”的模型。
據(jù)介紹,Gemini有三種不同版本的套件:最大、最強(qiáng)大的Gemini Ultra,是谷歌目前創(chuàng)造的最強(qiáng)大的大語(yǔ)言模型(Large Language Model,LLM);適用于廣泛任務(wù)的 Gemini Pro,將大量為谷歌人工智能服務(wù)提供動(dòng)力,并成為Bard的支柱;以及輕便版本Gemini Nano,可以在安卓設(shè)備上原生離線(xiàn)運(yùn)行。
目前,谷歌通過(guò)谷歌云將Gemini授權(quán)給客戶(hù)。12月13日起,開(kāi)發(fā)者和企業(yè)客戶(hù)都可以通過(guò)谷歌人工智能工作室或谷歌云頂點(diǎn)人工智能中的Gemini API訪問(wèn)Gemini Pro。安卓開(kāi)發(fā)者也可以使用Gemini Nano進(jìn)行開(kāi)發(fā)。Gemini還支持谷歌產(chǎn)品,如Bard聊天機(jī)器人和生成式搜索工具。
據(jù)The Verge報(bào)道,在基準(zhǔn)測(cè)試中,Gemini最明顯的優(yōu)勢(shì)來(lái)自于它理解視頻和音頻并與之交互的能力。皮查伊在一篇博文中寫(xiě)道:“Gemini一開(kāi)始就是為多模態(tài)打造的,這意味著它可以生成并理解、操作和組合成不同類(lèi)型的信息,包括文本、代碼、音頻、圖像和視頻。”谷歌DeepMind首席執(zhí)行官德米斯·哈薩比斯說(shuō):“我們一直對(duì)通用系統(tǒng)感興趣,尤其感興趣的是如何混合所有這些模式——從任何數(shù)量的輸入和感官中收集盡可能多的數(shù)據(jù),然后給出同樣多樣的響應(yīng)。”
目前Gemini最基本的輸入模式依然是文本輸入和輸出,但Gemini Ultra將可以輸入和生成更多的圖像和音頻。哈薩比斯說(shuō):“還有動(dòng)作和觸覺(jué),這些輸入和生成,更像是機(jī)器人需要的功能。”隨著時(shí)間的推移,Gemini將變得擁有更多知覺(jué),并變得更加準(zhǔn)確和接地氣。“模型會(huì)更好地理解周?chē)氖澜纭?rdquo;
除此之外,Gemini已經(jīng)確定會(huì)很快融入到谷歌的業(yè)務(wù)中。在接下來(lái)的幾個(gè)月中,Gemini將出現(xiàn)在更多谷歌產(chǎn)品和服務(wù)中,例如搜索、廣告、Chrome和Duet AI。不過(guò)Gemini目前只有英語(yǔ)版本,其他語(yǔ)言版本很快就會(huì)推出。
領(lǐng)先GPT-4?
根據(jù)谷歌公司此前發(fā)布的博文,Gemini Ultra是第一個(gè)在大規(guī)模多任務(wù)語(yǔ)言理解(MMLU)測(cè)試中超越人類(lèi)專(zhuān)家的模型。MMLU測(cè)試包括57個(gè)學(xué)科,例如數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等,這個(gè)測(cè)試用于評(píng)估模型對(duì)世界知識(shí)和解決問(wèn)題的能力。據(jù)稱(chēng),該模型能夠理解復(fù)雜主題中的微妙之處和推理邏輯。
桑達(dá)爾·皮查伊表示,Gemini的發(fā)布,是人工智能發(fā)展的一個(gè)重要里程碑,也是谷歌新時(shí)代的開(kāi)始。但人們最關(guān)注的問(wèn)題恐怕還是Gemini和今年3月推出的GPT-4相比,孰優(yōu)孰劣。
谷歌公司高管稱(chēng),Gemini Pro的表現(xiàn)優(yōu)于GPT-3.5,但回避了關(guān)于它與GPT-4相比的問(wèn)題。不過(guò),根據(jù)谷歌此前發(fā)布的一份白皮書(shū),Gemini Ultra在一些基準(zhǔn)測(cè)試中的表現(xiàn)優(yōu)于GPT-4。
哈薩比斯表示:“我們已經(jīng)對(duì)這兩個(gè)系統(tǒng)進(jìn)行了全面的分析和基準(zhǔn)測(cè)試。谷歌運(yùn)行了32項(xiàng)成熟的基準(zhǔn)測(cè)試,對(duì)兩種模型進(jìn)行了比較,其中既有多任務(wù)語(yǔ)言理解基準(zhǔn)測(cè)試等整體測(cè)試,也有比較兩種機(jī)型生成Python代碼能力的測(cè)試。”哈薩比斯說(shuō):“我認(rèn)為,在32項(xiàng)基準(zhǔn)測(cè)試中,Gemini Ultra有30項(xiàng)大幅領(lǐng)先。”“有些差距很小,有些則比較大。”
天使投資人、知名互聯(lián)網(wǎng)專(zhuān)家郭濤表示,目前而言微軟在自然語(yǔ)言處理技術(shù)(NLP)成熟度和應(yīng)用上領(lǐng)先于谷歌,但總體來(lái)看,谷歌在AI技術(shù)研發(fā)及儲(chǔ)備上領(lǐng)先于微軟,旗下多款A(yù)I產(chǎn)品都擁有全球領(lǐng)先的地位,如DeepMind、Waymo、Google Brain等。
在郭濤看來(lái),微軟與谷歌的AI競(jìng)爭(zhēng)是下一代信息分發(fā)獲取方式的競(jìng)爭(zhēng),基于認(rèn)知智能等新技術(shù)可實(shí)現(xiàn)更高效的信息整合和知識(shí)推薦,讓信息獲取更加高效、內(nèi)容更加精準(zhǔn)。未來(lái)或顛覆傳統(tǒng)搜索引擎、資訊網(wǎng)站等,成為最重要的信息入口。
中泰資本董事王冬偉指出,微軟和谷歌在不同領(lǐng)域的AI技術(shù)研究和應(yīng)用都有所側(cè)重。微軟在自然語(yǔ)言處理和語(yǔ)言模型方面表現(xiàn)突出,而谷歌則在計(jì)算機(jī)視覺(jué)和圖像識(shí)別方面具備領(lǐng)先地位。因此,微軟可能會(huì)在自然語(yǔ)言處理、文本生成、語(yǔ)音識(shí)別等領(lǐng)域?qū)雀璁a(chǎn)生沖擊,而在計(jì)算機(jī)視覺(jué)、圖像識(shí)別、自動(dòng)駕駛等領(lǐng)域可能仍需要進(jìn)一步發(fā)展。
利潤(rùn)轉(zhuǎn)化
Gemini發(fā)布后, 12月7日美股盤(pán)前谷歌漲近3%。桑達(dá)爾·皮查伊表示,現(xiàn)在已經(jīng)有數(shù)百萬(wàn)人正在使用谷歌產(chǎn)品中的生成式AI,做一年前還做不到的事情。與此同時(shí),開(kāi)發(fā)人員正在使用谷歌的模型和基礎(chǔ)架構(gòu)構(gòu)建新的生成式AI應(yīng)用程序,全球的初創(chuàng)公司和企業(yè)也正在利用谷歌的AI工具不斷成長(zhǎng)。
因此在Gemini的開(kāi)發(fā)過(guò)程中,谷歌也加強(qiáng)了安全審查工作。哈薩比斯介紹,在谷歌的AI原則和產(chǎn)品安全政策基礎(chǔ)上,谷歌團(tuán)隊(duì)正為Gemini的多模態(tài)能力添加新的保護(hù)措施。
比起大眾,投資者更關(guān)心的是AI是否能夠轉(zhuǎn)化為實(shí)際回報(bào)。此前在谷歌第三季財(cái)報(bào)電話(huà)會(huì)議上,投資者向高管們提出了許多關(guān)于如何將人工智能轉(zhuǎn)化為實(shí)際利潤(rùn)的問(wèn)題。
從科技巨頭們最新的財(cái)報(bào)來(lái)看,只有微軟達(dá)到了華爾街的預(yù)期。有分析指出,微軟的優(yōu)勢(shì)在于,現(xiàn)有的大部分業(yè)務(wù)收入都來(lái)自于向企業(yè)銷(xiāo)售軟件和云服務(wù),而企業(yè)更傾向于盡早為技術(shù)付費(fèi),因?yàn)檫@些技術(shù)可以幫助企業(yè)實(shí)現(xiàn)從編碼、電子表格分析到PPT制作的自動(dòng)化。
《華爾街日?qǐng)?bào)》稱(chēng),大型科技公司正在努力應(yīng)對(duì)將AI產(chǎn)品轉(zhuǎn)變?yōu)閷?shí)際利潤(rùn)的挑戰(zhàn),而運(yùn)行高級(jí)AI模型的成本可能是這一過(guò)程中的重大障礙。當(dāng)前的成本挑戰(zhàn)與AI算力有關(guān),這使得AI服務(wù)的固定費(fèi)用模式存在風(fēng)險(xiǎn),因?yàn)樵黾涌蛻?hù)使用量可能會(huì)增加運(yùn)營(yíng)成本并導(dǎo)致公司出現(xiàn)潛在損失。微軟企業(yè)戰(zhàn)略主管Chris Young也認(rèn)為,AI的投資回報(bào)將需要更多時(shí)間。
北京商報(bào)記者 方彬楠 趙天舒
本網(wǎng)站所有內(nèi)容屬北京商報(bào)社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報(bào)總機(jī):010-64101978 媒體合作:010-64101871
商報(bào)地址:北京市朝陽(yáng)區(qū)和平里西街21號(hào) 郵編:100013 法律顧問(wèn):北京市中同律師事務(wù)所(010-82011988)
網(wǎng)上有害信息舉報(bào) 違法和不良信息舉報(bào)電話(huà):010-84276691 舉報(bào)郵箱:bjsb@bbtnews.com.cn
ICP備案編號(hào):京ICP備08003726號(hào)-1 京公網(wǎng)安備11010502045556號(hào) 互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號(hào)