2026年3月,小鹏发布了自动驾驶世界模型(X-World)的技术报告,揭示了小鹏世界模型X-World的构建与使用,并展示了这一技术在小鹏汽车自动驾驶中的实际使用价值。近日,小鹏集团世界模型技术再突破,发布了X-Cache技术报告。X-Cache ...
DeepSeek-V3.2-Exp 所搭载的稀疏化 Attention 计算,在长上下文场景中成功降低了推理延迟。但在 PD 分离架构下,随着序列长度不断增长,Decode 阶段的吞吐受限问题愈发凸显。核心症结在于,Decode 过程中 Latent Cache 规模会随序列长度呈线性增长,而 GPU 显存容量有限 ...
baron (网名:代码改变世界ctw),九年手机安全/SOC底层安全开发经验。擅长trustzone/tee安全产品的设计和开发 1.cache是多级相连的 ...
编者按:这是我们酝酿了非常久的一个训练营,由在阅码场做了多次相关分享的甄建勇老师执鞭。旨在帮助想要从事或者正在从事性能优化的工程师深入到计算机体系结构。之所以选择从cache开始,是因为cache在计算机体系结构能够顶半边天。尤其是愈演愈烈的AI ...
锐龙9 9950X3D2 Dual Edition的出现意味着AMD在处理器性能方面继续保持了无可争议的全面领先地位,这种局面在较长时间内都不会改变。