當前位置: 華文世界 > 科技

AI伺服器專家交流電話會紀要

2024-03-25科技

Q:國內對輝達的推理卡,比如A30、A40以及L40的需求量有多大?

A:國內對輝達的各類推理卡需求量很大。A30、A40包括L40這類卡,在推理套用場景中的需求量至少有10萬片以上。尤其是隨著各種套用場景 落地和大量小模型的部署,這些卡的需求量會進一步上升。目前,對於可 銷售的A40、A10,包括L20,甚至p0等卡片,已經有較高的需求,我們 已經從使用者那裏收集到了一些訂單需求。

Q:現在輝達的訓練卡和推理卡的供應情況是怎樣的?24年的市場形勢 預測是什麽?

A:目前國內能夠獲取的輝達的主要產品為p0和L20卡。p0是基於 hopper架構,具有96G的HBM3緩存。它與p00使用相同的芯片組和緩存 組,視訊記憶體甚至比p00的80G更大。p0支持4TB/s的GPU記憶體速率,尤其 在單晶訓練方面的效能出色,主要用於推理工作。另一方面,L20的視訊記憶體 則是p0的一半,而記憶體傳輸速率下降了三到四倍。就2024年而言,如果 技術和政策環境保持穩定,預計p0、L20等卡片能夠正常交付,滿足市場 需求。但是,在AI追趕的競爭中,國內產品與最新的NVD產品的效能差距 將越來越大,這可能會導致國內需要更多的裝置來趕上國際的訓練和推理 服務速度。具體到數量,很難估計。

Q:輝達的顯卡目前國內的價格是怎樣的?生成(神農)卡的交付量及 價格狀況如何?

A:p00P3E卡在國內的價格大約為245,000元,L20約為75,000元,p0 接近140,000元。此外,RTX的4090卡在春節後價格上漲,目前為20,000 元。對於生成(神農)卡,以八卡整機的形式,價格大約在150萬左右。神農卡去年的交貨量大約為150,000片,2024年可能會提升到20到25萬 片。這意味著神農卡的需求量在上升,部份原因可能與國內對於AI和深度 學習計算需求的增加有關。

Q:可以分析一下國內伺服器企業的競爭格局和各自的優劣勢嗎?

A:國內伺服器市場的主要競爭者包括浪潮、新華三、三超融合、聯想、戴爾,以及寧唱(中科曙光旗下品牌)。浪潮以產品能力和大規模交付能 力突出,具備強大的客製化能力,特別是在互聯網和通訊營運商市場。浪 潮在GPU算力伺服器領域占有率曾高達50%以上,但因技術限制和交付問 題,在當前環境下受到較大影響。三超融合脫離華為後,失去了華為的整 體解決方案優勢,競爭力受到影響。新華三在通用伺服器市場占有率大約 7%-10%,在AI伺服器市場接近15%。新華三透過大型系統整合商滿足中 型行業使用者,並透過pC和惠普產品維持市場競爭力。寧唱則是利用中科 曙光在高效能計算領域的底蘊維護市場。戴爾的策略則是透過分銷模式觸 達中小企業客戶。

Q:能詳細介紹一下輝達的伺服器卡產品在中國市場的情況嗎?

A:國內能買到的高端輝達產品主要有H800和p00。H800,一個中國 特供版產品,因為一些公開招標企業不能取消訂單,從海外市場進口了一 部份庫存,價格在300至310萬人民幣。p00價格略低,在280至290萬人 民幣。對於輝達的PCIE產品,A7100的價格大約是25萬人民幣,按照8 張卡計算,總價在200萬人民幣左右。而L40和A40的價格分別在110萬和 70萬人民幣左右。最新的L20目前市場價大約75萬人民幣。p0目前在中 國市場還未銷售,但其效能預估會比L20高一倍,單卡價格可能是13至14 萬人民幣,整機預估價格超過120萬人民幣。

Q:浪潮公司AI伺服器毛利率與通用計算伺服器相比有何不同?

A:AI伺服器的毛利率相對於通用計算伺服器有顯著提升。通用計算伺服器 多年來的毛利率維持在10%左右,而AI伺服器至少提升了五個百分點,我

們估計AI伺服器的毛利率應該在16%到20%以下這個區間,但是肯定高於 15%。

Q:所提到的16%毛利率是否包含了GPU卡?

A:16%的毛利率是不包含GPU卡的。我們是基於GPU伺服器機型與通用 計算伺服器機型在未插入GPU卡時進行的對比分析。通用伺服器和AI服務 器在沒有GPU卡時,毛利存在百分點的差距。

Q:客戶購買AI伺服器時,GPU卡是由客戶自行采購嗎?

A:不是全部如此。對於非禁售的產品,浪潮等整機廠商主導銷售,比如 L20、L2,以及A10這類卡。而對於禁售的卡如A800、H800、L40S等,則 需要客戶透過渠道商或整合商自行采購單卡。

Q:浪潮伺服器的毛利與凈利如何可量化?

A:以通用型伺服器為例,均價在65000到70000元左右,OEM廠商可以賺 到5000元左右的毛利。而AI伺服器,如果不含GPU卡,其機身和其他配件 較貴,以HGX整機為例,機身售價在17萬到20萬元之間,毛利能達到3萬 到4萬,大約是通用計算伺服器的6到8倍。

Q:銷售GPU和儲存時的策略是什麽?是否會在此過程中獲利?

A:當幫客戶采購了GPU和儲存等電子料後,OEM廠商會獲得一定利潤。利潤通常來自占用的資金成本和服務費,大約是部件或服務費3%到5%的 利潤。對於核心元件的采購,如H800等,價格雖然可能在300萬左右,但 在非禁售情況下可能只能以200到210萬的價格銷售,整機廠商相應的服務 獲利就會相對減少。這就是為什麽很多廠商都積極銷售自家的AI算力服務 器,因為即使在相對較低的占用費用上,也能透過高毛利的硬體銷售獲得 較高的整體利潤。

Q:互聯網大廠的GPU卡、CPU、記憶體和硬碟等關鍵零部件的采購流程是 怎樣的?與OEM廠商有何關系?

A:互聯網大廠通常有自己的特定型號,和上遊廠商談量談價後,由OEM 廠商去競標,墊資購入這些核心零部件,然後裝到整機再交付。其中,互 聯網大廠可以拿到子型號的特殊價格和供給保障。OEM廠商在這個過程中 能賺取的主要是關鍵零部件的資金占用成本的費用,一般在一兩個百分 點。

Q:小型廠商的采購模式與大廠有何不同?可以操作的空間有哪些?A:小型廠商通常只能購買整機,這時OEM廠商有更多操作空間。OEM廠 商可能會根據情況引導使用者,提供不同的CPU、記憶體或容量和介面不同的 硬碟。小型廠商需要由伺服器廠家來采購相關的零部件。

Q:目前對於液冷技術的發展趨勢如何?哪些廠商在液冷方面走在前列?A:在碳中和的大趨勢下,由於AI伺服器耗電量大,采用液冷散熱方式成為 價效比高的解決方式。浪潮提出了all-in液冷戰略,已經將旗下幾乎所有服 務器產品配備液冷方案,使用者可以根據需求選擇風扇版或液冷版。液冷技 術主要有冷板式液冷和背板式液冷兩種方式。浪潮在液冷方面做得比較 好,幾乎所有產品都設計了液冷方案。

Q:液冷產品的提供商是由伺服器廠商自己提供還是第三方供應?

A:NVIDIA現在支持液冷,初期它的硬體設計沒有包含液冷方案,但現在 其硬體產品已經支持這一點。在液冷產品供應方面,伺服器廠商需對自己 的裝置重構和設計,數據中心需要支持從伺服器端到機櫃端熱量液態交換 的設施。液冷散熱不再是單純透過空氣,而是需要透過冷卻水迴圈散熱。

Q:未來如果p0可以銷售,國內訓練用的廠家是更傾向於購買p0還是說 它價效比不高,采購欲望不如p00或H800?

A:p0相比原來的p00在效能上有所削減,它的效能大約是p00的25到 30%,這意味著需要更多的裝置和網路組網來維持同等的算力,導致整體 成本升高。這會使得需要大規模模型訓練的互聯網使用者至少會考慮其他方 案,比如算力租賃或者購買一些所謂禁售的產品。因此,p0可能不會受 到國內廠家的青睞,它們更傾向於繼續采購p00和H800,甚至是輝達 剛釋出的最新GPU卡。這是因為對國內而言,這些算力卡相當於戰略物 資。特別是考慮到輝達新釋出的B200芯片效能可能是p00的五倍,相 比華為和寒武紀的產品,效能優勢可能達到數十倍,甚至20倍,所以國內 市場對於B200的需求可能會更大。

Q:相對於升騰910等國產化芯片,您怎麽看它們在市場上的競爭力?A:目前國內在生產GPU的HBM快取芯片方面,大概只能做到第二代 p00所使用的第五代HBM芯片。華為的升騰910及其他相關國產芯片主要 集中在推理端,而在訓練端包括升騰910,它們在效能上還是遜色於英偉 達的p00。考慮到這些因素,即使是升騰910,由於供給限制和生態相容 性問題,其在市場上的競爭力也有限。大部份國產算力卡不論是生產還是 效能,都在推理端占主導地位,而在訓練端則相對較弱。

紀要來源:【文八股調研】小程式