DeepSeek最新論文:訓(xùn)練速度提升9倍,推理速度快11倍!
電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)周二xAI發(fā)布了Grok3,這個(gè)馬斯克稱(chēng)之為“地球上最聰明的AI”搶占了所有人的眼球。 ? 為了打造最強(qiáng)AI大模型,xAI投入了20萬(wàn)塊H100 GPU,計(jì)算資源是上一代Grok2的15倍左右。在Benchmarks中,Grok3毫無(wú)懸念成功地領(lǐng)先Deepseek R1、o3 mini等對(duì)手。 ? 不過(guò)用如此大規(guī)模的算力集群,花費(fèi)上一代15倍的計(jì)算資源投入,業(yè)界認(rèn)為Grok3的性能只是略微提升了大模型能力上限,實(shí)際提升幅度低于算力投入的預(yù)期。這或許也預(yù)示著大模型的Scaling L
發(fā)表于02-20 11:25 ? 1633