原标题:“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗? 英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力? 硬件媒体Tom‘s Hardware带来开年最新热议: ...
但问题是,英伟达是否会坐以待毙?经过多年的发展,这家公司早已不仅仅是一家硬件制造商,更是深度学习和人工智能领域的重要推动者。面对新技术的崛起,英伟达有可能会加速推进自己的生态系统,例如通过软件更加深度的优化来应对竞争。同时,英伟达也关注技术的前沿,持 ...
【新智元导读】 DeepSeek模型开发竟绕过了CUDA?最新爆料称,DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示,CUDA护城河不存在了?
此外,DeepSeek-V3的出现让人联想到了AI自我编写底层代码的未来,有消息称DeepSeek-R1成功提升了大模型推理的速度,Llama.cpp项目中的一个新PR请求更是采用了DeepSeek生成的代码。这个PR中有99%的代码来自DeepSeek-R1的作品,令人惊叹!
7月17日消息,据Wccftech报导,英国新创公司Spectral Compute推出了一款名为“SCALE”的GPGPU编程工具包,将使得英伟达的CUDA生态软件能够在AMD的GPU上无缝 ...
从长远来看,若AMD能够改善其软件生态,注重用户体验 ... 仍旧难以撼动NVIDIA稳固的市场地位。总之,跨越CUDA护城河对AMD而言,不仅是一场硬件 ...
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时,他们针对自己的需求把 132 个流式多处理器(SMs)中的 20 个修改成负责服务器间的通信,而不是计算任务 。
来自 Mirae Asset Securities Research(韩国未来资产证券) 的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器 (SMs) 中的 20个修改成负责服务器间的通信,而不是计算任务 。