DeepSeek爆火後多次宕機
1月27日,DeepSeek日間多次宕機,API和網頁性能出現異常。1月28日,DeepSeek再度宕機。DeepSeek表示,由於自家開發的人工智能(AI)助理DeepSeek遭受大規模網路攻擊,公司正限制新用戶註冊。
彭博(Bloomberg News)報導稱,DeepSeek公司指出,截至中國當地時間27日晚間9時32分,部分問題已獲得解決,此時距離公司首次揭露當機災情已過了一個多小時。
驚動美國總統
DeepSeek爆火後,他自稱訓練成本低廉,且從編寫複雜程式到解決困難的計算能力不遜於競爭對手。消息衝擊美股,造成AI相關公司股價暴跌,尤其美國芯片巨頭英偉達(NVIDIA),1月27日當天股價暴跌約17%,市值一天蒸發5000億美元。
消息也驚動了美國總統川普。他在佛羅里達說:「中國公司推出的人工智能DeepSeek應該給我們的行業敲響警鐘,我們需要集中精力在競爭中取勝。」
DeepSeek的低成本
AI開發商Anthropic執行長阿莫戴(Dario Amodei)去年曾說,打造一個AI模型需花費1億至10億美元。但DeepSeek官方表示,訓練DeepSeek其中最新一款模型的成本僅為560萬美元。約為常規成本的2%。
上述消息在引起業界驚詫和好奇之外,也引發了諸多質疑。
Scale AI 首席執行官 Alexandr Wang 在接受CNBC採訪時表示:Deepseek擁有大約50,000顆英偉達最先進的GPU H100,「但是很明顯他們不能說出來,因為這違反了美國所實施的出口管制,我相信他們擁有(的H100)比外界想象的更多,他們未來會被芯片管制,和出口管制所限制」。
50,000顆英偉達H100的市值約為15億美元。
顯然,在Alexandr Wang看來,Deepseek沒有什麼了不起,只是大力出奇蹟而已。
今年剛滿28歲的Alexandr Wang是Scale AI的創始人兼CEO。Scale AI成立於2016年,是一家數據標注公司,旨在提供機器學習所需的準確數據。2024年,Scale AI的估值達到了138 億美元。
《華爾街日報》報道表示,關於DeepSeek的說法,還有很多未知數。幾位分析師對DeepSeek以如此低成本打造出可與美國先進AI模型媲美的產品的觀點提出質疑。
花旗集團(Citigroup)的Atif Malik寫道:「雖然DeepSeek的成就可能具有開創性,但我們對其在沒有使用先進GPU進行微調的情況下取得這一成就的說法表示懷疑。」
曾旅居中國多年的臺灣財經媒體人胡采蘋也認為DeepSeek的開發成本是假的。她在臉書上寫道:DeepSeek的母公司幻方量化是最重視芯片軍火裝備的一家公司,中國媒體過去報道過幻方如何大量添購GPU、是中國準備最足的一家公司。而「幻方聲稱他們用A800、降速芯片開發,這根本是無從驗證的說法。」
新包裝的大外宣?
提出質疑的還有資深媒體人矢板明夫。他在社交媒體X平台上貼文表示,按他多年的經驗,他認為非常有可能這是中共當局發動的一個大外宣。
他說:這家公司是2023年在杭州成立的新興企業。註冊資本才1000萬人民幣,但其背景卻非常神秘。不難想像,後面一定有中共的國家力量在支持。所以,中方所宣傳的「低成本」,到底是真是假,我認為還需要相關的查證。
矢板明夫繼續寫道:而且,「中共太喜歡造假了。早在20年前,曾發表研製出了高性能晶片『漢芯』,中共官媒吹捧了好幾年,結果被證明是造假。 去年還有一位17歲的讀服裝科系的高職女學生,在阿里巴巴全球數學競賽中,奪得全球第12名,而被當作是神童在網路爆紅,但後來被踢爆,原來是數學老師在背後幫忙造假。」
「我很難相信,在一個所有人都必須學習《習近平治國理政》,沒有思想、言論自由的國家,其企業能夠在技術上不斷創新、領先世界。」
中國前法律工作者杜文的質疑則顯得更直接了當。他在X上貼文說:「我從不相信任何對中共的吹捧,以我對中共的了解,他們不過是偷竊抄襲和造假而已,所有看上去先進、遙遙領先的數據都是宣傳、都是泡沫和謊言。用不了多久就會把底褲暴漏出來。中國當前共產統治的土壤出不來open ai和太空探索一樣的公司,就像荊棘上長不出葡萄。」
杜文曾是中共內蒙古政府法律室執行主任,曾因執行上級命令被栽贓判冤獄12年多。
社交平台X帳號「財經真相」貼文說:還記得十幾年前華為一幫小青年打敗思科西方高科技公司的神話故事,後來證明是中共軍方和幾個國家級的科研所背後共同努力,成果掛靠的華為團隊。「天朝(指中共)從來都沒有神話,如果有也是披着小年輕的外衣的國家力量」。
DeepSeek的優勢技術
對此,DeepSeek算法小組表示,他們使用了FP8混合精度訓練,至少在部分數值上,他們將傳統的32位浮點訓練改為8位,以此來簡化運算量,減少了75%的內存需求,顯著降低算力消耗,同時保持高精度性能。
而具有通訊博士背景的時政評論人章天亮則表示,從32位、16位改為8位,「這樣的一種簡化是匪夷所思的,如果是通過這樣的一種簡化就能夠把整個運算的算力成本降低50倍的話,那為什麼美國人會想不到,為什麼其他別的AI公司想不到呢?」
DeepSeek還表示,他們使用的是多標記預測系統,打破了傳統的逐字逐句生成的低效模式,讓模型一次性處理整句或多句內容,推理速度提升2倍,準確率高達 90%,大幅提高訓練與推理效率。
對此,章天亮表示:這是一個非常難的事情。按照計算機加密原理,將單個字母的加密、破解變成分塊加密、破解,這對算力的要求不是降低了,而是應該大幅增加。
對於DeepSeek所宣稱的自己的按需調用參數的專家系統,章天亮認為也是漏洞百出。DeepSeek宣稱專家系統與巨型模型激活所有參數的傳統方式不同,即在其 671億參數中,僅有37億參數被激活以處理特定任務,顯著減少計算開銷。相比之下,傳統模型的1.8萬億參數全部常駐運行,資源利用率極低。
章天亮認為,這只是針對一次提問的運算,但是作為一個機器人,在同一時間不可能只回答一個問題,無數的人同時問問題的時候,它的參數都得調進來。「那怎麼才能夠這麼有效的去找到你所需要的參數,這是一個非常非常讓人不可理解的東西」。
除此之外,DeepSeek的言論審查以及搜集用戶信息也受到了越來越多的質疑。
中共統治人民的最重要手段就是欺騙。維持大面積的對華廣播不斷傳遞真相,就是持續地給中國注入希望。希望之聲誠邀您和我們一起攜手努力。歡迎點擊了解詳情。

