您的位置: 首頁 > 推薦

DeepSeek時(shí)刻:云巨頭集中接入

出處:北京商報(bào) 作者: 魏蔚 網(wǎng)編:王巍 2025-02-04

2月2日—4日,騰訊云、百度智能云、阿里云先后接入DeepSeek相關(guān)大模型,而大廠在春節(jié)假期為深度求索公司加班,只是DeepSeek爆火的一個證據(jù)。英偉達(dá)市值蒸發(fā)創(chuàng)紀(jì)錄、OpenAI上新o3-mini推理模型、DeepSeek卡頓、榜單第一……與深度求索直接間接相關(guān)的新聞,在春節(jié)期間不斷刷新。

單論擁抱DeepSeek,海外同行的動作更快,微軟、英偉達(dá)、亞馬遜云科技等在1月底就已接入。據(jù)稱DeepSeek以3%的成本超越了OpenAI,且開源,這意味著以低成本已可訓(xùn)練出足夠好的AI模型。不管是為了客戶的多樣化需求,還是為了構(gòu)建AI生態(tài),云廠商快速接入最火的大模型,都是筆劃算的買賣。

北京商報(bào)

七巨頭集結(jié)

“讓更多開發(fā)者便捷調(diào)用DeepSeek,騰訊云再出一把力。”2月4日,騰訊云又一次拉近與DeepSeek的距離,在騰訊云TI平臺推出“開發(fā)者大禮包”:DeepSeek全系模型一鍵部署,部分模型限免體驗(yàn)。在此之前,騰訊云已在2月2日宣布將DeepSeek-R1大模型一鍵部署至騰訊云“HAI”上,開發(fā)者僅需3分鐘就能接入調(diào)用,一改以往慢吞吞的風(fēng)格。

更早打出低價(jià)牌的是百度智能云,2月3日,百度智能云千帆平臺正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低價(jià)格方案,用戶還可享受限時(shí)免費(fèi)服務(wù)。

北京商報(bào)記者了解到,目前騰訊云TI平臺采用按量計(jì)費(fèi)和包年包月計(jì)費(fèi)模式,百度智能云千帆平臺限時(shí)免費(fèi)2周至2月18日24:00。

阿里云也在春節(jié)期間就開了工,“大年初六,我們進(jìn)入正題”,阿里云以此開場,在2月3日宣布阿里云PAI ModelGallery支持云上一鍵部署DeepSeek-V3、DeepSeek-R1。

對于費(fèi)用,阿里云相關(guān)人士以全部部署好所需資源為例向北京商報(bào)記者介紹,“部署DeepSeek-R1-Distill-Qwen-7B模型的價(jià)格約為11.1元/小時(shí)(以A10機(jī)型為例);部署DeepSeek-R1模型的價(jià)格約為316元/小時(shí)。模型部署成功后按實(shí)例運(yùn)行時(shí)長計(jì)費(fèi),不滿1小時(shí)按具體分鐘數(shù)折算計(jì)費(fèi)”。目前阿里云百煉平臺也已上線DeepSeek-R1和DeepSeek-V3模型API,且面向用戶限時(shí)免費(fèi)中。

華為云則在2月1日即宣布,硅基流動與華為云團(tuán)隊(duì)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek-R1/V3推理服務(wù)。

這波比拼中,不在春節(jié)假期的海外公司占了先機(jī)。

1月31日,英偉達(dá)宣布,NVIDIA NIM(一種云原生微服務(wù)技術(shù))已經(jīng)可以使用DeepSeek-R1。微軟同日稱已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業(yè)級AI服務(wù)平臺的一部分。

亞馬遜云科技(AWS)也宣布:企業(yè)和開發(fā)者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型,還可以使用AWS Trainium等以經(jīng)濟(jì)高效的方式部署DeepSeek-R1-Distill模型。

春節(jié)彩蛋

不是深度求索2025年1月20日發(fā)布的DeepSeek-R1,就是2024年12月26日上線的全新系列模型DeepSeek-V3,海內(nèi)外大廠接入的,正是春節(jié)前就在各大主流媒體和社交網(wǎng)站刷屏的大模型“黑馬”。

“突然間,美國在人工智能領(lǐng)域相對于中國的領(lǐng)先地位,似乎比自ChatGPT走紅以來的任何時(shí)候都要小。”英國《經(jīng)濟(jì)學(xué)人》雜志評論,理由是“一家中國公司(即深度求索)發(fā)布了最新的令人印象深刻的大語言模型”。

從數(shù)據(jù)到體感,印象深刻的例子不難找。

七麥數(shù)據(jù)顯示,1月27日至今,DeepSeek在中國內(nèi)地免費(fèi)蘋果總榜、應(yīng)用榜、效率榜均排在第一名,放大到全球榜單,截至北京商報(bào)記者發(fā)稿,DeepSeek在72個地區(qū)的免費(fèi)蘋果總榜、應(yīng)用榜、效率榜位居榜首。

根據(jù)AI產(chǎn)品榜1月31日的數(shù)據(jù),DeepSeek上線18天日活用戶數(shù)1500萬,ChatGPT達(dá)到同樣的數(shù)據(jù)用了244天,增速是ChatGPT的13倍之多,DeepSeek被公認(rèn)為是全球增速最快的AI應(yīng)用。

除了大模型的真本事,春節(jié)或許也是DeepSeek加速擴(kuò)散的原因之一。

2025年1月28日除夕夜,在互聯(lián)網(wǎng)大廠工作的林悅(化名)把DeepSeek生成的拜年祝福分享在家族群。就這樣,DeepSeek被“分發(fā)”到天南海北,那晚他給自己及親戚好友生成了不低于10個新春祝福。第二天,林悅在西北四線城市生活的阿姨告訴他,自己在社交平臺刷到了談?wù)揇eepSeek的短視頻。

再比如登上熱搜第一的話題:“DeepSeek回答如何過好這一生”,它的回復(fù)是:“沒有完美的人生劇本,所有選擇都有代價(jià),關(guān)鍵是要有承擔(dān)選擇的勇氣。”北京商報(bào)記者也向DeepSeek提出了同樣的問題,嘗試多次后DeepSeek均顯示“服務(wù)器繁忙,請稍后再試”,火爆程度可見一斑。

“拼多多”路徑

需要強(qiáng)調(diào)的是,“中國的大語言模型并非最頂尖的,但它們的制造成本要低得多”,《經(jīng)濟(jì)學(xué)人》舉例,阿里旗下的通義千問QwQ-32B-Preview于2024年11月推出,與美國的頂尖模型相比,差距不到3個月,DeepSeek在一項(xiàng)標(biāo)準(zhǔn)評估中排名第七。

報(bào)道稱,DeepSeek是由2000多塊二流芯片訓(xùn)練而來,Meta的模型則用了1.6萬塊頂尖芯片。在某些排名中,DeepSeek的表現(xiàn)甚至超過了Meta的模型。訓(xùn)練一個美國的大語言模型成本高達(dá)數(shù)千萬美元,而且還在上升,而DeepSeek方面表示,其訓(xùn)練成本不到600萬美元。

提到DeepSeek火爆的原因,工信部信息通信經(jīng)濟(jì)專家委員會委員盤和林表示,“DeepSeek采取低價(jià)和開源兩條路并行的策略,尤其是開源,之前全球AI開發(fā)者都要看Meta的臉色,因?yàn)樽钣忻拈_源模型是Llama,有了DeepSeek,Llama立馬不香了,而那些收費(fèi)較高的,如ChatGPT則受到較大打擊,免費(fèi)和收費(fèi)哪個香?很容易作出決斷,DeepSeek也算中國第一個打通國內(nèi)國外應(yīng)用生態(tài)的產(chǎn)品”。

“模型成本的下降對產(chǎn)業(yè)鏈上的云服務(wù)廠商存在利好。”在比達(dá)分析師李錦清看來,這正是云廠商火速接入DeepSeek的原因,站在市場競爭力與商業(yè)價(jià)值看,“接入DeepSeek模型有助于云廠商提升自身在AI領(lǐng)域的競爭力,吸引更多開發(fā)者和企業(yè)客戶。通過提供DeepSeek模型的部署和應(yīng)用服務(wù),云廠商可以拓展業(yè)務(wù)范圍,增加收入來源”。

北京商報(bào)記者 魏蔚

右側(cè)廣告
新聞排行

本網(wǎng)站所有內(nèi)容屬北京商報(bào)社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報(bào)總機(jī):010-64101978 媒體合作:010-64101871

商報(bào)地址:北京市朝陽區(qū)和平里西街21號 郵編:100013 法律顧問:北京市中同律師事務(wù)所(010-82011988)

網(wǎng)上有害信息舉報(bào)  違法和不良信息舉報(bào)電話:010-84276691 舉報(bào)郵箱:bjsb@bbtnews.com.cn

ICP備案編號:京ICP備08003726號-1  京公網(wǎng)安備11010502045556號  互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號