2月2日—4日,騰訊云、百度智能云、阿里云先后接入DeepSeek相關(guān)大模型,而大廠在春節(jié)假期為深度求索公司加班,只是DeepSeek爆火的一個證據(jù)。英偉達(dá)市值蒸發(fā)創(chuàng)紀(jì)錄、OpenAI上新o3-mini推理模型、DeepSeek卡頓、榜單第一……與深度求索直接間接相關(guān)的新聞,在春節(jié)期間不斷刷新。
單論擁抱DeepSeek,海外同行的動作更快,微軟、英偉達(dá)、亞馬遜云科技等在1月底就已接入。據(jù)稱DeepSeek以3%的成本超越了OpenAI,且開源,這意味著以低成本已可訓(xùn)練出足夠好的AI模型。不管是為了客戶的多樣化需求,還是為了構(gòu)建AI生態(tài),云廠商快速接入最火的大模型,都是筆劃算的買賣。
七巨頭集結(jié)
“讓更多開發(fā)者便捷調(diào)用DeepSeek,騰訊云再出一把力。”2月4日,騰訊云又一次拉近與DeepSeek的距離,在騰訊云TI平臺推出“開發(fā)者大禮包”:DeepSeek全系模型一鍵部署,部分模型限免體驗(yàn)。在此之前,騰訊云已在2月2日宣布將DeepSeek-R1大模型一鍵部署至騰訊云“HAI”上,開發(fā)者僅需3分鐘就能接入調(diào)用,一改以往慢吞吞的風(fēng)格。
更早打出低價(jià)牌的是百度智能云,2月3日,百度智能云千帆平臺正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低價(jià)格方案,用戶還可享受限時(shí)免費(fèi)服務(wù)。
北京商報(bào)記者了解到,目前騰訊云TI平臺采用按量計(jì)費(fèi)和包年包月計(jì)費(fèi)模式,百度智能云千帆平臺限時(shí)免費(fèi)2周至2月18日24:00。
阿里云也在春節(jié)期間就開了工,“大年初六,我們進(jìn)入正題”,阿里云以此開場,在2月3日宣布阿里云PAI ModelGallery支持云上一鍵部署DeepSeek-V3、DeepSeek-R1。
對于費(fèi)用,阿里云相關(guān)人士以全部部署好所需資源為例向北京商報(bào)記者介紹,“部署DeepSeek-R1-Distill-Qwen-7B模型的價(jià)格約為11.1元/小時(shí)(以A10機(jī)型為例);部署DeepSeek-R1模型的價(jià)格約為316元/小時(shí)。模型部署成功后按實(shí)例運(yùn)行時(shí)長計(jì)費(fèi),不滿1小時(shí)按具體分鐘數(shù)折算計(jì)費(fèi)”。目前阿里云百煉平臺也已上線DeepSeek-R1和DeepSeek-V3模型API,且面向用戶限時(shí)免費(fèi)中。
華為云則在2月1日即宣布,硅基流動與華為云團(tuán)隊(duì)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek-R1/V3推理服務(wù)。
這波比拼中,不在春節(jié)假期的海外公司占了先機(jī)。
1月31日,英偉達(dá)宣布,NVIDIA NIM(一種云原生微服務(wù)技術(shù))已經(jīng)可以使用DeepSeek-R1。微軟同日稱已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業(yè)級AI服務(wù)平臺的一部分。
亞馬遜云科技(AWS)也宣布:企業(yè)和開發(fā)者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型,還可以使用AWS Trainium等以經(jīng)濟(jì)高效的方式部署DeepSeek-R1-Distill模型。
春節(jié)彩蛋
不是深度求索2025年1月20日發(fā)布的DeepSeek-R1,就是2024年12月26日上線的全新系列模型DeepSeek-V3,海內(nèi)外大廠接入的,正是春節(jié)前就在各大主流媒體和社交網(wǎng)站刷屏的大模型“黑馬”。
“突然間,美國在人工智能領(lǐng)域相對于中國的領(lǐng)先地位,似乎比自ChatGPT走紅以來的任何時(shí)候都要小。”英國《經(jīng)濟(jì)學(xué)人》雜志評論,理由是“一家中國公司(即深度求索)發(fā)布了最新的令人印象深刻的大語言模型”。
從數(shù)據(jù)到體感,印象深刻的例子不難找。
七麥數(shù)據(jù)顯示,1月27日至今,DeepSeek在中國內(nèi)地免費(fèi)蘋果總榜、應(yīng)用榜、效率榜均排在第一名,放大到全球榜單,截至北京商報(bào)記者發(fā)稿,DeepSeek在72個地區(qū)的免費(fèi)蘋果總榜、應(yīng)用榜、效率榜位居榜首。
根據(jù)AI產(chǎn)品榜1月31日的數(shù)據(jù),DeepSeek上線18天日活用戶數(shù)1500萬,ChatGPT達(dá)到同樣的數(shù)據(jù)用了244天,增速是ChatGPT的13倍之多,DeepSeek被公認(rèn)為是全球增速最快的AI應(yīng)用。
除了大模型的真本事,春節(jié)或許也是DeepSeek加速擴(kuò)散的原因之一。
2025年1月28日除夕夜,在互聯(lián)網(wǎng)大廠工作的林悅(化名)把DeepSeek生成的拜年祝福分享在家族群。就這樣,DeepSeek被“分發(fā)”到天南海北,那晚他給自己及親戚好友生成了不低于10個新春祝福。第二天,林悅在西北四線城市生活的阿姨告訴他,自己在社交平臺刷到了談?wù)揇eepSeek的短視頻。
再比如登上熱搜第一的話題:“DeepSeek回答如何過好這一生”,它的回復(fù)是:“沒有完美的人生劇本,所有選擇都有代價(jià),關(guān)鍵是要有承擔(dān)選擇的勇氣。”北京商報(bào)記者也向DeepSeek提出了同樣的問題,嘗試多次后DeepSeek均顯示“服務(wù)器繁忙,請稍后再試”,火爆程度可見一斑。
“拼多多”路徑
需要強(qiáng)調(diào)的是,“中國的大語言模型并非最頂尖的,但它們的制造成本要低得多”,《經(jīng)濟(jì)學(xué)人》舉例,阿里旗下的通義千問QwQ-32B-Preview于2024年11月推出,與美國的頂尖模型相比,差距不到3個月,DeepSeek在一項(xiàng)標(biāo)準(zhǔn)評估中排名第七。
報(bào)道稱,DeepSeek是由2000多塊二流芯片訓(xùn)練而來,Meta的模型則用了1.6萬塊頂尖芯片。在某些排名中,DeepSeek的表現(xiàn)甚至超過了Meta的模型。訓(xùn)練一個美國的大語言模型成本高達(dá)數(shù)千萬美元,而且還在上升,而DeepSeek方面表示,其訓(xùn)練成本不到600萬美元。
提到DeepSeek火爆的原因,工信部信息通信經(jīng)濟(jì)專家委員會委員盤和林表示,“DeepSeek采取低價(jià)和開源兩條路并行的策略,尤其是開源,之前全球AI開發(fā)者都要看Meta的臉色,因?yàn)樽钣忻拈_源模型是Llama,有了DeepSeek,Llama立馬不香了,而那些收費(fèi)較高的,如ChatGPT則受到較大打擊,免費(fèi)和收費(fèi)哪個香?很容易作出決斷,DeepSeek也算中國第一個打通國內(nèi)國外應(yīng)用生態(tài)的產(chǎn)品”。
“模型成本的下降對產(chǎn)業(yè)鏈上的云服務(wù)廠商存在利好。”在比達(dá)分析師李錦清看來,這正是云廠商火速接入DeepSeek的原因,站在市場競爭力與商業(yè)價(jià)值看,“接入DeepSeek模型有助于云廠商提升自身在AI領(lǐng)域的競爭力,吸引更多開發(fā)者和企業(yè)客戶。通過提供DeepSeek模型的部署和應(yīng)用服務(wù),云廠商可以拓展業(yè)務(wù)范圍,增加收入來源”。
北京商報(bào)記者 魏蔚
本網(wǎng)站所有內(nèi)容屬北京商報(bào)社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報(bào)總機(jī):010-64101978 媒體合作:010-64101871
商報(bào)地址:北京市朝陽區(qū)和平里西街21號 郵編:100013 法律顧問:北京市中同律師事務(wù)所(010-82011988)
網(wǎng)上有害信息舉報(bào) 違法和不良信息舉報(bào)電話:010-84276691 舉報(bào)郵箱:bjsb@bbtnews.com.cn
ICP備案編號:京ICP備08003726號-1 京公網(wǎng)安備11010502045556號 互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號