本站 2 月 9 日消息,飛騰信息技術有限公司昨日晚發文宣布,旗下騰云 S5000C 和騰銳 D3000 成功實現對 DeepSeek 全系列大模型的端到端支持,覆蓋數據中心和終端場景,本地部署的推理效率與國外同類產品架構解決方案相當。
據介紹,DeepSeek-V2.5 236B 大模型于2024 年在飛騰騰云 S5000C 平臺實現穩定運行。基于飛騰騰云 S5000C 設備搭配 8 塊國產 AI 卡,整體性能可達國外平臺性能 80% 左右。DeepSeek-V3 和 R1 版本發布后,飛騰技術團隊在騰云 S5000C 平臺和騰銳 D3000 上對其進行本地部署驗證,形成整體解決方案。
數據中心側,飛騰騰云 S5000C 服務器可與多款 AI 加速卡配合實現 DeepSeek 蒸餾版和全量版部署。飛騰 AI 實驗室在單機 8 卡服務器平臺已進行蒸餾版 DeepSeek-R1-Distill-Llama-70B 版本測試,推理速度可達 22tokens / s。完整版 DeepSeek R1 671B 模型采用分布式推理框架,基于四機 32 卡 AI 服務器集群運行可部署成功。
用戶終端側,基于飛騰騰銳 D3000 的臺式機可以本地部署 DeepSeek-R1 7B 蒸餾版模型,搭配 1 張國產推理卡,實現 AI PC 能力。
本站附飛騰騰云 S5000C和飛騰騰銳 D3000 兩款 CPU 的主要信息如下:
騰云 S5000C
飛騰騰云 S5000C 擁有 64 核、32 核、16 核 3 種產品形態,兼容 ARMv8 指令集,支持硬件虛擬化,產品支持商業和工業分級,該產品主要面向計算服務器、存儲服務器、AI 服務器、高端網安、行業級業務主機服務器系統、大型互聯網數據中心等場景。
騰銳 D3000
飛騰騰銳 D3000 集成 8 個飛騰自主研發的新一代高性能處理器核 FTC862,兼容 64 位 ARMv8 指令集并支持 ARM64 和 ARM32 兩種執行模式,支持單精度、雙精度浮點運算指令和 ASIMD 處理指令,主頻達到 2.5GHz,支持硬件虛擬化,支持商業和工業分級。