中昊芯英发布了其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力达到了 896 TFLOPS。与上一代芯片「刹那」相比,「须臾」的性能提升了三倍。此外,该芯片的 8-bit 推理算力高达 1792 TOPS,能够应对需要处理大量词元且并发量高的人工智能推理任务。
「须臾」在显存容量和芯片内部互联速度方面均有显著增强,并支持超长上下文处理能力。其单卡额定功耗为 600W,相较于传统的算力芯片,功耗降低了 50%,为构建低碳数据中心提供了支持。
值得注意的是,「须臾」芯片的 IP 核、专用指令集、底层算子加速库以及整机系统软件均为完全自主研发,不依赖任何海外核心技术。这使得该芯片能够满足政务、金融、电网等行业在安全和合规方面的要求。
与「须臾」一同发布的还有高性能智算平台「泰则 2.0」。该平台以其为最小计算单元,集成了两颗高性能 CPU 处理器和八片高性能 TPU 处理单元。其物理形态为一个通用的 CPU 服务器外接一个高性能 TPU 算力加速设备,整体算力可达 7.168 PFLOPS(混合精度)。在执行相同任务时,「泰则 2.0」的整体能耗仅为传统 GPU 服务器的 80%。
在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的全面兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。对于训练场景,它适配了 DeepSpeed 和 Megatron-LM 等分布式套件。该平台已成功深度适配了 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言及多模态模型,使开发者能够快速完成模型的迁移工作。

精彩评论
球迷代表:卡隆·巴利纳
2026年5月10日 回复世界杯2026围绕世界杯赛程不断创新,回应用户的真实需求。
球迷代表:朱莉娅斯·罗伊
2026年5月12日 回复精选世界杯竞猜内容,世界杯2026与你一同发现更多精彩。
球迷代表:阿里斯塔·威廉姆森
2026年5月15日 回复世界杯2026专注世界杯直播,为用户提供专业可靠的体验。