【財新網(wǎng)】官宣5天的開源周,DeepSeek在第六天“放大招”。3月1日,DeepSeek公布了其V3、R1兩個模型官方推理服務的整體系統(tǒng)概覽,和上線后的成本及理論營收情況。DeepSeek稱,其提供V3、R1兩個模型推理服務的GPU租賃成本約為8.71萬美元/天,而一天理論收入為56.20萬美元,成本利潤率為545%。
具體來看,DeepSeek官方的推理服務采用波峰、波谷定價,白天用戶推理需求較高,DeepSeek用所有的GPU節(jié)點提供推理服務;而夜間推理負荷低,DeepSeek就減少推理節(jié)點,以用于研究和訓練。DeepSeek稱,在北京時間2月27日中午12點,至2月28日中午12點的24小時內(nèi),DeepSeek V3和R1推理服務占用節(jié)點總和,峰值占用為278個節(jié)點,平均占用226.75個節(jié)點(每個節(jié)點為 8 個 H800 GPU),假定 GPU租賃成本為2美元/小時,總成本為87,072美元/天。