2025年初,全球人工智能領(lǐng)域的聚光燈突然轉(zhuǎn)向一家名不見(jiàn)經(jīng)傳的中國(guó)初創(chuàng)公司——杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)。這家企業(yè)憑借一款名為“DeepSeekV3”的大語(yǔ)言模型引發(fā)全球轟動(dòng)。
DeepSeek的故事始于中國(guó)杭州的一間共享辦公室,深度求索公司成立于2023年7月17日,由知名量化資管巨頭幻方量化創(chuàng)立。創(chuàng)始團(tuán)隊(duì)由梁文鋒等幾位年輕科學(xué)家組成,創(chuàng)業(yè)初期立下DeepSeek的理想主義:開(kāi)源、降本與AI普惠。
2024年1月5日發(fā)布DeepSeek LLM,這是深度求索的第一個(gè)大模型。2024年12月26日晚,DeepSeek正式上線全新系列模型DeepSeek-V3首個(gè)版本并同步開(kāi)源。這個(gè)大模型有6710億參數(shù),激活參數(shù)為370億,在14.8萬(wàn)億token(詞元)上進(jìn)行了預(yù)訓(xùn)練。在沒(méi)有預(yù)熱、沒(méi)有炒作的情況下,“DeepSeek-V3”模型迅速走紅,達(dá)到了令人咋舌的程度。
官方數(shù)據(jù)顯示,該模型多項(xiàng)評(píng)測(cè)成績(jī)超越了頭部開(kāi)源模型,它在性能上與世界頂尖的閉源模型GPT-4o不分伯仲。令A(yù)I界感到不可思議的是這款大模型的訓(xùn)練成本極其低廉。官方技術(shù)論文披露,DeepSeek-V3在預(yù)訓(xùn)練階段僅使用2048塊GPU訓(xùn)練了2個(gè)月,且只花費(fèi)557.6萬(wàn)美元。而GPT-4o的模型訓(xùn)練成本約為1億美元。憑借獨(dú)有的技術(shù)架構(gòu)與算法優(yōu)化,DeepSeek大幅削減模型研發(fā)與運(yùn)維成本,實(shí)現(xiàn)低成本高回報(bào)。以達(dá)成與OpenAI o1模型相當(dāng)性能為例,耗費(fèi)資金僅為其3%-5%,這引起了硅谷的巨大轟動(dòng)。要知道,OpenAI一直在巨虧——僅去年就“燒”掉了50億美元。其2023年至2028年預(yù)計(jì)累計(jì)虧損高達(dá)440億美元,2026年的支出可能攀升至95億美元。
Meta CEO扎克伯格則評(píng)價(jià)說(shuō),DeepSeek展現(xiàn)出的技術(shù)實(shí)力和性能令人印象深刻,并指出中美之間的AI差距已經(jīng)微乎其微。
Meta首席AI科學(xué)家Yann Lecun表示,DeepSeek-R1面世與其說(shuō)意味著中國(guó)公司在AI領(lǐng)域正在超越美國(guó)公司,不如說(shuō)意味著開(kāi)源大模型正在超越閉源。他在社交媒體直言:“西方公司該醒醒了,中國(guó)同行正在定義新的游戲規(guī)則。”
前谷歌首席執(zhí)行官埃里克·施密特表示,DeepSeek的崛起標(biāo)志著全球人工智能競(jìng)賽的“轉(zhuǎn)折點(diǎn)”,證明中國(guó)可以用更少的資源與大型科技公司競(jìng)爭(zhēng)。
微軟首席執(zhí)行官薩提亞?納德拉在瑞士達(dá)沃斯的世界經(jīng)濟(jì)論壇上表示:“DeepSeek的新模型令人印象深刻,尤其是在如何高效開(kāi)發(fā)開(kāi)源模型并進(jìn)行推理計(jì)算方面,它的計(jì)算效率非常出色。我們應(yīng)當(dāng)非常、非常認(rèn)真地對(duì)待來(lái)自中國(guó)的這些技術(shù)進(jìn)展?!?/p>
英偉達(dá)在聲明中指出,DeepSeek在人工智能技術(shù)的創(chuàng)新與應(yīng)用方面,展現(xiàn)了難以置信的成就。
DeepSeek的確在全球技術(shù)領(lǐng)域豎起了一個(gè)重要的里程碑。中國(guó)科學(xué)家以超人的智慧應(yīng)對(duì)美國(guó)對(duì)中國(guó)高端芯片的封殺,以低功能芯片和低成本殺入世界頂級(jí)AI大模型的巔峰。
DeepSeek以令人稱奇的使用體驗(yàn)帶來(lái)強(qiáng)勁的擴(kuò)散效應(yīng),在蘋果AppStore應(yīng)用商店美國(guó)區(qū)登頂,超越了長(zhǎng)期霸榜的ChatGPT。有報(bào)道說(shuō),目前160多個(gè)國(guó)家或地區(qū)下載榜同時(shí)登頂!僅俄羅斯就有超過(guò)500萬(wàn)人下載使用。隨著人們下載使用體驗(yàn)感的提升,相信這款大模型的全球下載量將越來(lái)越多,前途不可限量。
DeepSeek異軍突起,實(shí)力盡顯鋒芒。中國(guó)用戶面對(duì)DeepSeek這種強(qiáng)大的人工智能,從質(zhì)疑、體驗(yàn)到全民狂歡似乎是一夜之間。的確,AI已經(jīng)把未來(lái)送到了每個(gè)人的家門口。今日頭條和小紅書等各大平臺(tái)上處處都是使用這一大模型的體驗(yàn)和指令輸出范例,稱奇者比比皆是。
DeepSeek的成功,不僅象征著中國(guó)在AI領(lǐng)域科技實(shí)力的大幅提升,更顯現(xiàn)著中國(guó)在全球未來(lái)科技競(jìng)爭(zhēng)中話語(yǔ)權(quán)份量在增強(qiáng)。《金融時(shí)報(bào)》將其描述為“震驚國(guó)際科技界的黑馬”,認(rèn)為其性能已與資金雄厚的OpenAI等美國(guó)競(jìng)爭(zhēng)對(duì)手的模型相媲美?!督?jīng)濟(jì)學(xué)人》表示,認(rèn)為中國(guó)AI技術(shù)在成本效益方面的快速突破,已經(jīng)開(kāi)始動(dòng)搖美國(guó)的技術(shù)優(yōu)勢(shì)。
BBC則報(bào)道稱,中國(guó)新推出的人工智能應(yīng)用程序DeepSeek以驚人的速度震撼了科技行業(yè)、市場(chǎng)以及美國(guó)在人工智能領(lǐng)域的優(yōu)越感。
據(jù)報(bào)道,DeepSeek大模型遭遇了史上最大規(guī)模網(wǎng)絡(luò)攻擊,溯源顯示攻擊源來(lái)自美國(guó)。1月28日凌晨,DeepSeek官網(wǎng)的服務(wù)狀態(tài)頁(yè)面發(fā)布了一份緊急聲明,指出其線上服務(wù)近期遭遇了大規(guī)模的惡意攻擊。由于此次攻擊的影響,新用戶的注冊(cè)過(guò)程變得異常繁忙,甚至有時(shí)無(wú)法完成,DeepSeek迅速調(diào)整了服務(wù)器的配置和策略,加強(qiáng)了網(wǎng)絡(luò)安全防護(hù),有效地抵御了攻擊的進(jìn)一步蔓延。他們與多家知名的網(wǎng)絡(luò)安全公司建立了緊密的合作關(guān)系,共同應(yīng)對(duì)這次攻擊。
DeepSeek正全力加快AI智能生態(tài)的發(fā)展和豐富,加快從工具到生態(tài)的躍進(jìn)。近日,DeepSeek團(tuán)隊(duì)正式發(fā)布了兩款多模態(tài)框架——Janus-Pro和JanusFlow。其中,Janus-Pro是一款統(tǒng)一多模態(tài)理解與生成的創(chuàng)新框架,通過(guò)解耦視覺(jué)編碼的方式,極大提升了模型在不同任務(wù)中的適配性與性能,不僅展示了DeepSeek在技術(shù)創(chuàng)新方面的實(shí)力,也為用戶提供了更加多樣化和高效化的AI服務(wù)。
從“無(wú)名之輩”到“現(xiàn)象級(jí)AI公司”,從技術(shù)自信到生態(tài)布局,DeepSeek的崛起已超越商業(yè)范疇。以技術(shù)奇點(diǎn)重新定義AI賽道的底層邏輯和大模型范式,已經(jīng)打破從技術(shù)、產(chǎn)業(yè)到資本市場(chǎng)對(duì)AI發(fā)展的固有認(rèn)知,掀起了一場(chǎng)前所未有的技術(shù)變革,它正在演繹的是未來(lái)科技智慧之戰(zhàn),或者說(shuō)是技術(shù)理想主義與國(guó)家使命的演進(jìn)。中國(guó)科技正在為人類命運(yùn)共同體提供數(shù)字時(shí)代的創(chuàng)新范例,這是一場(chǎng)技術(shù)理想主義與國(guó)家宏大戰(zhàn)略的共振,更是一個(gè)古老文明在智能時(shí)代的強(qiáng)勢(shì)宣言。
AI來(lái)自于人類的智慧,并將催化智慧之光。智能文明時(shí)代需要更多的深度求索公司,相信中國(guó)科技界會(huì)涌現(xiàn)出更多的創(chuàng)新“黑馬”?。?span style="font-kerning: none;">中國(guó)日?qǐng)?bào)網(wǎng)特約撰稿人:鞠傳江)
?