手机版 丰华网络
最近,华为在MoE训练系统方面,给出了MoE训练算子和内存优化新方案:三大核心算子全面提速,系统吞吐再提20%,Selective R/S实现内存节省70%。在通往更强大的AI路上,MoE已成为科技巨头另一个首选路径。只要Scaling Law没有失效,大模型的参数规模依旧不断扩大,由此AI智能水平
2025-06-04 16:39:00每经记者:张韵 每经编辑:董兴生DeepSeek上线以来,国产算力资源的采购意愿显著提升。3月24日,《每日经济新闻》记者在上海电信“算力超市”看到,数据安全敏感型的企业更倾向于选择专属化部署方案。相比传统IDC(互联网数据中心)服务,云端专属算力服务已支持专线接入DeepSeek大模型,进一步解决
2025-03-29 21:21:00IT之家 3 月 8 日消息,华尔街日报昨日(3 月 7 日)报道,有“欧版 OpenAI”之称的法国公司 Mistral AI 计划拥抱开源策略,计划发布一款超越 DeepSeek 的新模型。在 2025 世界移动通信大会上,Mistral AI 公司首席执行官 Arthur Mensch 表示,
2025-03-08 15:14:00中新网北京3月4日电 “您好,我想注册一家企业。”登录北京市企业服务e窗通平台输入需求后,智能问答助手“市监小e”即刻开始工作:“好的,请您先确认拟设立的主体类型……”经过简短沟通,小e迅速理解了办事人的需求,依托DeepSeek大模型在语义理解、自主学习、智能推理方面的核心技术突破,为申请人生成了
2025-03-04 16:06:00炉火依旧通红。但钢铁冶炼操作台前的,却不再只是“老师傅”。4月29日,“改革立潮头 实干挑大梁”大众报业集团驻地方媒体联合采访·日照行活动走进日照市岚山区。记者现场看到,在日照钢铁控股集团有限公司1780平方米的铁前集控大厅里,铁前和炼铁环节的2000多个监控点的情况,在401块大屏幕上一“幕”了然
2025-04-30 00:13:00近日,上海移动联合上海市消防救援总队完成DeepSeek的本地化部署,携手探索DeepSeek在智慧消防的深度应用。考虑到数据隐私与安全、性能与实时性以及定制化与扩展性的现实需求,上海市消防救援总队拟定了以实战需求为导向,以提升业务能力为目标的实践路径,通过DeepSeek本地化部署模式进行深度应用
2025-03-13 22:14:00IT之家 3 月 23 日消息,图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)做客 20 日播出的“Big Technology Podcast”科技播客节目,谈到了当前生成式 AI 为何难以做出科学发现以及未来 AI 如何发展等话题。他表示,大语言模型等现有 AI 技术本质
2025-03-23 22:53:0021世纪经济报道记者白杨 北京报道在AI技术飞速发展的今天,云端AI已经不再是唯一的焦点。随着隐私保护、实时响应和能效优化等需求的日益凸显,端侧AI正逐渐成为行业的新风向标。在2025年世界移动通信大会(MWC 2025),AI不仅仅是技术的展示焦点,它的应用也已经开始真正落地。这一变化表明,AI不
2025-03-06 19:00:00IT之家 4 月 14 日消息,LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名,其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 Meta 为刷榜向 LMArena 提供“特供版”Llama 4 大模型的质疑。4 月 6 日,Meta
2025-04-14 15:07:00极目新闻记者 张秀娟想订舱却找不到对接窗口?如何在技术支持下,实现物流运输资源的高效配置?3月11日,极目新闻记者从湖北港口集团获悉,基于湖北供应链物流公共信息平台,该集团已完成DeepSeek-R1 671B全量版本本地化部署。行业大模型界面通过使用“微调+RAG(检索增强生成)”技术,搭建起“湖
2025-03-11 18:03:00网站内容来自网络,如有侵权请联系我们,立即删除!
Copyright © 丰华网络 琼ICP备2024036866号-5