
“最佳銷售”黃仁勛終于看到了冰山消融的可能:就在昨天,美國總統特朗普通過其社交媒體宣布,經過與中方的溝通,美國將允許芯片巨頭英偉達向中國的“經過批準的客戶”出口其先進的AI芯片H200。
特朗普在文章中提到,此舉將為美國帶來就業和制造業的增強,并提及中方將為此支付25%的額外費用。
從今年4月14日起,英偉達AI芯片被實質禁止對華銷售,雖然7月份英偉達官宣獲批出口許可,但并未實際向中國客戶交付H20芯片。
產品難以進入中國市場,肯定是英偉達的損失,但對于國產平替們來說,這段時間卻是難得的發展窗口。寒武紀股價狂漲,摩爾線程火線上市,就連老牌大廠百度,也傳出了有可能將昆侖芯拆分上市的消息。
H200可能解禁,是否意味著“國產平替”們窗口的關閉呢?
至少二級市場不這么認為。
“國產平替”里最先上市的摩爾線程,其股價不但沒有預想中的大幅下跌,反而在開盤后呈現小幅低開后快速翻紅的走勢,收盤628.31元/股,當日漲幅達5.73%,對應總市值直逼3000億元,第二天繼續上漲,收盤價達到735元,漲幅16.98%。可見市場對此并不擔憂,反而視為利好。
同樣國產平替陣營中,最近比較火的百度AI芯片公司昆侖芯,因為其并非上市企業,并不能直接看出英偉達解禁H200對其的影響。然而,從長期來看,由于國產替代戰略的存在,以及本土芯片廠商的獨特優勢,李廠長再造一個“寒武紀”,沒準真不是一個沒法實現的夢想,而H200也很難成為這條路上的攔路虎。

英偉達CEO黃仁勛曾在10月公開表示,在美國實施嚴格的出口管制之前,英偉達的高端AI芯片在中國市場占據主導地位,市場份額超過95%。從A100到H100,這些芯片是中國各大互聯網公司、科研機構訓練大模型的核心引擎。
然而出口管制政策實施后,英偉達在華市場份額從95%驟降至接近0%。2025年三季度,其在華AI芯片銷售額占總營收不足0.1%。昆侖芯等國產廠商開始迅速填補這個空缺。
IDC數據顯示,2024年中國自主研發的AI芯片在國內市場的份額已攀升至30%,2025年預計將突破50%。
H200獲準進入中國市場的消息,給市場帶來了震動。雖然英偉達最新的旗艦產品是基于Blackwell架構的B200系列,但H200依然是一款高性能芯片。

它基于成熟的Hopper架構,擁有與旗艦H100相同的989 TFLOPS的FP16/BF16半精度浮點算力,集成了約16896個CUDA核心和528個第四代Tensor Core。其最大的亮點是配備了高達141GB的HBM3e高帶寬內存,內存帶寬達到驚人的每秒4.8TB,這甚至超過了H100的80GB HBM3內存和3.35TB/s的帶寬。
對于需要處理萬億參數、消耗海量顯存的大模型訓練任務而言,更大的內存容量和帶寬意味著可以容納更大的模型、使用更大的批次進行訓練,從而顯著提升效率。
事實上,H200的回歸并非意味著英偉達能完全重奪中國市場。
第一個難題就是高昂的價格。按照單顆H200售價約4萬美元計算,25%的抽成意味著每顆芯片需要額外支付1萬美元。這使得H200的實際采購成本遠高于此前的H100,也高于國產同類產品。
其次是配額限制。銷售僅限于“經批準的客戶”,并由美國商務部進行審查。這意味著大量中小企業和被列入實體清單的機構無法獲得采購資格,而這恰恰是國產芯片的主要市場空間。
更重要的是市場分化的趨勢。英偉達的優勢在于極致性能和成熟的CUDA生態,這對追求尖端算力的頭部互聯網公司具有吸引力。但在強調安全可控的政務、金融、能源等關鍵領域,國產替代已成為剛性需求,H200難以進入。
然而需要強調的是,H200的性能與此前英偉達專為中國市場推出的“閹割版”H20形成了鮮明對比。
盡管H20擁有看似不錯的96GB顯存,但其算力被大幅削減至僅148 TFLOPS。據美國智庫進步研究所的報告評估,H200的性能是H20的6倍左右,這使其成為一個完全不同量級的競爭者。
這種性能上的巨大落差導致H20在市場上反應平平。騰訊控股總裁劉熾平在財報電話會議上明確表態,公司已儲備足夠的GPU庫存以支撐未來的模型訓練工作,無需采購H20。阿里云在2026財年第一季度財報中也表示,H20的實際算力表現“無法滿足大模型迭代需求”。
當前國產AI芯片主流算力多處于英偉達A100階段。比如寒武紀的旗艦產品思元590,明確對標英偉達A100;剛剛登陸科創板的摩爾線程,其AI芯片MTT S3000同樣對標A100。少數廠商產品僅接近H100水平,像沐曦計劃2026年下半年才對流片對標H100的產品進行研發,與H200存在明顯代差。
H200的回歸還給國內帶來了英偉達引以為傲的CUDA生態。
CUDA是一個包含了編譯器、庫、開發工具和開發者社區的完整生態系統。深度學習框架本身不具備直接調用GPU的能力,必須通過“中間適配層”才能讓GPU干活,而CUDA就是英偉達GPU的“專屬中間適配層”。過去十幾年,全球絕大多數AI研究和商業應用都在CUDA上構建。
百度飛槳可以適配昆侖芯,此時它不依賴CUDA,而是依賴昆侖芯的“專屬中間層”(XPU SDK)。但如果開發者的模型是構建在CUDA上的,那么想要使用昆侖芯去運行它,就必須得“翻譯”成飛槳能聽懂的代碼。
百度飛槳雖推出了插件式CUDA兼容類硬件接入方案,能讓硬件廠商復用部分CUDA算子,kernel復用率最高可達92.6%,但這只是針對硬件廠商的適配優化,在一些關鍵任務上,仍然需要開發者重新使用飛槳平臺編寫。
出于對開發效率、穩定性和生態成熟度的考量,部分追求極致性能且預算充足的商業客戶,可能會選擇繼續采用英偉達方案。但這并不意味著國產芯片會失去市場——兩者的目標客戶群體正在分化,英偉達吃高端市場,國產芯片則在中低端市場和安全可控領域站穩腳跟。
它基于成熟的Hopper架構,擁有與旗艦H100相同的989 TFLOPS的FP16/BF16半精度浮點算力,集成了約16896個CUDA核心和528個第四代Tensor Core。其最大的亮點是配備了高達141GB的HBM3e高帶寬內存,內存帶寬達到驚人的每秒4.8TB,這甚至超過了H100的80GB HBM3內存和3.35TB/s的帶寬。
對于需要處理萬億參數、消耗海量顯存的大模型訓練任務而言,更大的內存容量和帶寬意味著可以容納更大的模型、使用更大的批次進行訓練,從而顯著提升效率。

與其他國產AI芯片廠商不同,昆侖芯并非孤立的硬件產品,而是百度AI生態中的關鍵一環。
2021年,百度的智能芯片及架構部門完成了獨立融資,正式成立了昆侖芯(北京)科技有限公司。盡管已經成為一家獨立公司,百度依然是其控股股東,持有約59.45%的股份。
昆侖芯第一代產品在2020年量產,采用14nm工藝和自研的XPU架構,INT8算力為260TOPS,功耗控制在100瓦級別。
到目前量產的第三代P800芯片,工藝已升級至7nm,FP16算力達345TFLOPS——這個數字是英偉達中國特供版H20芯片的2.3倍。
更值得關注的是昆侖芯背后的全棧技術整合能力。
在百度構建的AI技術體系中,昆侖芯提供底層算力,飛槳(Paddle)深度學習框架負責中間調度,文心系列大模型則是最終應用。這種"芯片-框架-模型"的垂直整合模式,與谷歌的TPU芯片、TensorFlow框架和Gemini模型的組合如出一轍。

這種閉環帶來的好處是顯而易見的。
飛槳可以針對昆侖芯的硬件特性進行深度優化,文心大模型的訓練和推理效率因此得到提升;反過來,大模型的實際需求又為昆侖芯的迭代指明方向。
相比之下,其他國產芯片廠商往往需要適配多個主流框架,這在開發效率和性能優化上都面臨更大挑戰。
獨立運營后的昆侖芯,商業化進展超出了不少人的預期。
2024年營收突破10億元,市場預期2025年將增長至35億元以上,并有望實現盈虧平衡。更重要的是客戶結構的變化——最初更多依賴百度內部需求的昆侖芯,外部客戶占比正在快速擴大,覆蓋互聯網、電信運營商、大型央國企等關鍵領域。
2025年8月的一次中標頗具標志性意義:昆侖芯在中國移動10億級別的AI算力采購項目中,在三個標包中均排名第一。
但昆侖芯還不能高枕無憂,單從業務上看,昆侖芯采用Fabless模式,生產環節依賴外部代工。
2024年上半年其還能較容易地從臺積電獲取7nm晶圓代工產能,但隨著境外新規落地,先進制程晶圓代工和HBM供應等方面均受到不利限制。
同時,昆侖芯團隊的軟件優化和框架支持長期優先圍繞百度生態展開,對外部開源模型和小眾框架的支持度還不夠。
相較于其他AI芯片,昆侖芯的泛化能力還有提高的空間。
12月5日,昆侖芯完成新一輪融資,投后估值約210億元人民幣。
兩天后百度發布公告稱,正就擬議分拆及上市進行評估。據外媒報道,昆侖芯最初考慮科創板上市,但后來轉向香港證券交易所,計劃最早在2026年第一季度提交上市申請,目標是2027年初完成IPO。受此消息影響,百度港股股價在12月5日收盤時上漲5.01%。
對昆侖芯而言,獨立上市的意義不僅在于融資。更重要的是,它能讓昆侖芯的估值獨立于百度的傳統業務,避免廣告、搜索業務波動對其的影響,資本市場會按照AI芯片行業的邏輯對其進行估值。
在產品布局上,昆侖芯也在加速推進下一代產品。沈抖透露,針對大規模推理場景的M100芯片已完成回片,主打極致性價比,將于2026年上市。字節、阿里、騰訊等頭部互聯網客戶已拿到小規模樣片測試并小范圍部署,百度也規劃了M100芯片的大型集群部署場景。
這種“內部驗證+外部拓展”的商業化路徑,既降低了市場風險,又為產品迭代提供了真實的應用反饋。在英偉達H200可能回歸的背景下,昆侖芯或多或少也有底氣。

在H200回歸的新聞引發熱議的同時,更值得關注的是這次“解禁”背后的政策邏輯,以及它對國產AI芯片帶來的實際影響。
從政策細節看,這次調整并非一次徹底的“放開”,而是一種“有管理的開放”。
美國政府明確表示,基于Blackwell架構的芯片以及下一代Rubin架構芯片,仍然被嚴格禁止出口到中國。允許出口的H200,本質上是英偉達的上一代產品。換句話說,美國的核心策略并未改變——在最頂尖的AI技術上對中國保持代差優勢,同時通過出售"次旗艦"產品獲取經濟利益。
外媒分析認為,這種模式很可能成為未來美國對華科技出口管制的新常態:在不放棄技術霸權的前提下,有選擇性地通過出售非尖端但足夠強大的技術來平衡經濟利益與戰略考量,同時以此作為影響中國科技產業發展的籌碼。
然而,H200的回歸之路遠比表面看起來更加曲折。在美國內部,圍繞是否向中國放行高端芯片的爭議極大,這使得該政策的長期穩定性存在巨大疑問。
這其中最具代表性的是《SAFE CHIPS Act》(《安全芯片法案》)。
該法案要求美國商務部在30個月以上時間內拒絕向中國出口尖端半導體的申請。一旦這項法案獲得通過,特朗普將失去芯片出口的決策權。
外媒認為,特朗普政府火速審批H200放行,可能是在法案進入審議前搶占先手,通過行政批準制造既定事實。
同時,這種政策層面的不確定性,也讓中國企業開始擔憂GPU供應鏈。
即便現在可以采購H200以緩解短期算力需求,中國的頭部大廠和關鍵行業客戶也大概率不會完全放棄國產芯片的適配和應用。

目前國內AI企業普遍采用“雙備份”(Dual Sourcing)策略——百度自己就是如此,之前百度百舸采用的就是混合算力架構,既用自研昆侖芯,也用英偉達等芯片。
誠然,這種策略會增加短期的研發成本和系統復雜度,但從長遠來看,這是應對地緣政治不確定性的明智選擇。當供應鏈隨時可能因為政策變動而中斷時,技術自主權的價值遠超短期的成本增加。
在中國一側,國家層面對國產替代的政策支持力度也在持續加大。
國家集成電路產業投資基金二期募集金額已達2000億元以上,為芯片企業提供了強有力的資金保障。稅收優惠、研發補貼、政府采購傾斜等一攬子政策正在形成合力。國資委79號文更是明確要求,2027年底前實現所有中央企業信息化系統的國產替代。
這些政策信號清晰地表明,在關鍵技術領域,中國不會因為外部環境的短期變化而動搖自主研發的決心。對昆侖芯等國產AI芯片廠商而言,這意味著一個長期穩定且不斷擴大的市場空間。
一位接近百度的人士向字母榜透露,芯片本就是長周期規劃的產業,長期競爭因素始終存在,昆侖芯在產品迭代時就已考慮過相關變化,因此不需要做大的調整。昆侖芯在今年11月公布的未來5年發展方向中,已經規劃了M300以及超節點設備等產品線。
另一方面,H200允許進口后,可能也會改變百度的采購政策。不過百度方面并未向字母榜透露相關內容。
從更宏觀的視角看,H200的放行與昆侖芯的上市計劃,本質上是同一場技術博弈在不同維度的映射。前者代表著美國試圖在保持技術優勢的同時獲取經濟利益,后者則體現了中國在關鍵技術領域尋求自主可控的戰略定力。
在這場長期博弈中,短期的政策變動或許會帶來市場波動,但真正決定格局的,仍然是技術積累、生態建設和戰略耐心。對昆侖芯等國產AI芯片而言,挑戰依然嚴峻,但機遇同樣清晰——在一個注定分化的市場中,找到自己的立足點,并不斷向上突破。
而且,英偉達H200究竟能不能進入中國,目前來看,仍然是個未知數。
