
IT之家 2 月 13 日音问开云(中国)Kaiyun·官方网站 - 登录入口,科大讯飞今晚发布了最新的投资者关系手脚记载表,主要针对 DeepSeek 方面的问题进行解答。 科大讯飞暗意,飞正在侦查的纯国产算力的星火 X1 新版块预测在 3 月内完成,预期不错罢了数学答题和流程念念维链智商全濒临标致使逾越 OpenAI o1。 此外,科大讯飞还暗意他们正在将 X1 深度推理模子进一步贯串与中国教科院等诸多讲授巨匠的妥洽,通过专科常识反念念及长念念维链强化学习贯串,生成相宜讲授熏陶需求的“熏陶

IT之家 2 月 13 日音问开云(中国)Kaiyun·官方网站 - 登录入口,科大讯飞今晚发布了最新的投资者关系手脚记载表,主要针对 DeepSeek 方面的问题进行解答。
科大讯飞暗意,飞正在侦查的纯国产算力的星火 X1 新版块预测在 3 月内完成,预期不错罢了数学答题和流程念念维链智商全濒临标致使逾越 OpenAI o1。
此外,科大讯飞还暗意他们正在将 X1 深度推理模子进一步贯串与中国教科院等诸多讲授巨匠的妥洽,通过专科常识反念念及长念念维链强化学习贯串,生成相宜讲授熏陶需求的“熏陶念念维链”,提高复杂场景推理的逻辑正确性、专科性、可解释性,并将率先用于教诲助手、改削、辅学等全系家具改造,预测在 2025 世界数字讲授大会时代发布讲授专属大模子和改造应用。
IT之家摘选部分重心信息如下:
DeepSeek R1 快速对标 o1 的主要改造是其建议并罢了的 R1-Zero 强化学习侦查有缱绻,即平直在 DeepSeek-V3-base 预侦查模子上进行大畛域强化学习侦查,可在数学、代码等推理任务上得到接近 o1 模子的效果,而不依赖任何有监督微调(SFT),这是现时国表里公开已知的、在大畛域任务上获取到手效果的首个发布效力,之前学术界已有关联扣问,但因为预侦查基座模子不够好而使得强化学习的收益不好,这一效力具有较强的改造性,大大减少了数学、代码等任务考核对东说念主工标注推理流程数据的需求。
DeepSeek R1 并不是惟一高水平的国产深度推理大模子。2024 年 9 月 OpenAI o1-preview 发布以后,国内手艺最初的大模子厂商也在快速跟进。科大讯飞基于此前在考语模子、强化学习方面的集中,在 2024 年 10 月就罢了了蒙特卡洛树搜索(MCTS)等算法改造并跑通了深度推理模子侦查算法,因为只可使用国产算力,咱们极端破耗 2 个月完成华为昇腾 910B 算力的适配和优化并大幅擢升侦查效力(侦查效力比较 A100 从 55% 擢升到 85%),于本年 1 月 15 日完成了星火深度推理模子 X1 的侦查和发布。天然现时 X1 模子很小(仅 130 亿参数),但依靠咱们算法和数据上风,星火 X1 已达到不错和 OpenAI o1-preview 对成见水平;跟着国产算力的平稳到位,模子参数增多后,咱们总共有信心罢了数学答题和流程念念维链智商全濒临标致使逾越 OpenAI o1。此外,贯串与中国教科院等诸多讲授巨匠的妥洽效力,咱们将使得 X1 的念念维链驱散愈加相宜讲授熏陶的专科条目,在讲授、医疗等领域罢了更大的应用赋能价值。
DeepSeek 团队围绕 DeepSeek V3 和 R1 的侦查和推理降本,罢了了多个有用的软硬件贯串深度工程优化改造,包括 MLA(通过低秩矩阵对 KV 矩阵进行压缩权贵裁减 GPU 显存的吃亏)、MTP(通过多帧预测擢升数据应用率及侦查效果和推理效力)、DualPipe(通过更底层的 PTX 辅导优化英伟达 GPU 筹谋和通讯的并行)、FP8 夹杂精度侦查(业界初次使用 8Bit 量化浮点数时势罢了超大畛域模子的侦查,以往皆是使用 16Bit 量化),最终 DeepSeek 基于 2048 张英伟达 H800 卡,约 560 万好意思元就能完成 V3 模子的一次齐全预侦查。另外,DeepSeek R1 因为波及基于无数数据的强化学习迭代侦查,其资本未公布。
和 DeepSeek 近似,科大讯飞受限于有限的算力资源,昔时几年对于星火大模子侦查和推理资本效力的捏续优化也作念了无数插足,和 DeepSeek 平直使用英伟达 H800 卡上开展的多样工程优化不同,科大讯飞继承了更难的寰宇产算力阶梯。从 2023 年 5 月起科大讯飞就采集华为先后攻克了万卡高速互联组网、筹谋通讯荫藏、侦查推理强交互、高轮廓推理优化以及国产算子优化等一系列勤恳,将通用大模子、类 o1 的深度推理模子等的侦查效力对标 A100 均从最初的 30%-50% 优化达到了 85%-95% 以上;以 DeepSeek 十分敬重的万卡收罗通讯带宽的应用率为例,DeepSeek 报说念的是 93%,而讯飞星火作念到了 95%。侦查资本亦然讯飞星火大模子的竞争上风,咱们单次侦查资本和 DeepSeek V3 在一个档次,而且背面优化旅途也很明确,当今以昇腾 910B 为代表的国产硬件还不援助 FP8 精度侦查以及 DualPipe 的罢了,跟着国产算力在底层智商上进一步擢升,讯飞星火的侦查资本还有较大的下跌空间。
需要非常讲解的是,大模子对算力的需求为侦查和推理两个方面,而侦查罢了的难度繁密于推理。这等于天然继续有公司通知不错在国产算力平台上提供 DeepSeek 在内等大模子的推理做事,但仍只好讯飞星火一家是侦查和推理均在国产算力上进行的,况且仅用 1 万张 910B 国产算力卡,科大讯飞不仅用比友商少一个数目级的算力取得了大模子研发上的第一梯队效力,而且作念了无数国产算力平台上的无东说念主区的适配和效力优化,追求国产算力的极致效力,这比在英伟达上的罢了更需要手艺实力和计谋勇气。
现时总共全民下载的通用大模子 App 中, 只好讯飞星火一家是侦查和推理均在国产算力上进行的开云(中国)Kaiyun·官方网站 - 登录入口,仅用 1 万张 910B 国产算力卡,科大讯飞不仅用比友商少一个量级的算力取得了大模子研发上的一系列效力,而且作念了无数国产算力平台上的无东说念主区的适配和效力优化。天然继续有公司通知不错在国产算力平台上提供 DeepSeek 在内等大模子的推理做事,但当今仍只好讯飞星火一家是侦查和推理均在国产算力上进行的。
告白声明:文内含有的对外跳转流通(包括不限于超流通、二维码、口令等神色),用于传递更多信息,省俭甄选时辰,驱散仅供参考,IT之家总共著作均包含本声明。 ]article_adlist--> 声明:新浪网独家稿件,未经授权约束转载。 -->