效率跃升1.71倍,字节再降MoE训练成本,为何AI玩家接连开源最新技术? 训练大模型的成本之高一直是行业痛点,各路玩家都在思考如何用技术创新把成本“打”下来。3月10日,字节跳动豆包大模型团队发布了针对MoE(混合专家模型)架构的通信优化系统COMET,该方案通过细粒度计算-通信重叠技术,助力大模型训练优化。据豆包大模型团队介绍,COMET已实际应用于万卡级生产集群,累计...
快手-W早盘涨6%!花旗:维持“买入”评级,可灵大模型视频模型名列前茅,视为快手在人工智能领域不错切入点 快手-W(01024)早盘持续走高,股价上涨5.86%,现报66.80港元,成交额31.45亿港元。近日,花旗发布研报称,维持快手-W(01024)“买入”评级,目标价67港元。快手股价周四(6日)上涨超过13%,该行认为潜在受惠于今年中国政府工作报告中承诺支持人工智能,加上中央官员在记者会上提及“...
A股午评:三大指数弱势调整,军工股逆势活跃,白酒股走强!超4000股下跌,成交额9488亿缩量558亿;机构解读 3月11日消息,指数早盘弱势调整,创指、深成指盘中一度翻红后回落。板块方面,军工板块早盘强势,火炬电子(603678)、炼石航空(000697)、内蒙一机(600967)等涨停;白酒股震荡走强,山西汾酒(600809)、古井贡酒(000596)涨幅居前;国资云概念活跃,美利云(000815)、湖北广...
智元发布首个通用具身基座大模型GO-1 每经AI快讯,3月10日,据智元机器人官方公众号消息,“稚晖君”创业项目智元机器人今日发布了首个通用具身基座模型——智元启元大模型(GenieOperator-1),它开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,该架构由VLM(多模态大模型)+MoE(...
智元发布首个通用具身基座大模型:完成小样本快速泛化,降低具身智能门槛 3月10日,智元发布首个通用具身基座大模型——智元启元大模型(GO-1)。据了解,该架构由VLM(多模态大模型)+MoE(混合专家)组成。其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作数据获得通用的动作理解...
太突然!“计划有变,他不去了”!火爆出圈的明星公司,90后创始人取消武汉亮相 市场消息称,Manus创始人肖弘周二(3月11日)或将在武汉公开演讲,参与超擎数智协办的2025 NVIDIA创业企业展示武汉站活动,这可能是Manus出圈后创始人的第一次亮相。3月10日,Manus团队方面向《每日经济新闻》记者回应称,计划有变,他不去了。肖弘。图片来源:极目新闻援引点石创校公众号...
华为离职天才少年“稚晖君”放大招 训练机器人的大模型来了 凤凰网科技讯 3月10日,前华为天才少年“稚晖君”创业项目智元机器人今日发布首个通用具身基座模型——智元启元大模型(Genie Operator-1)。该模型提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构由VLM(多模态大模型) + MoE(混合专家)...
国家超算互联网平台接入阿里千问大模型 格隆汇3月10日|据全天候科技,国家超算互联网平台接入阿里巴巴通义千问大模型,对外提供千问QwQ-32B API服务,用户可免费获得100万 tokens。据了解,千问QwQ-32B是阿里通义团队最新开源(300109)的推理模型,在数学、代码及通用能力的多项权威评测集中,表现与“满血版”671...
第四范式:联合华为发布SageOne IA一体机 新浪科技讯 3月9日晚间消息,第四范式日前宣布联合华为昇腾AI升级发布SageOne IA一体机解决方案,在支持DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型的基础上,企业可灵活在满血版和多个蒸馏模型之间切换。据悉,该方案中集成了智能算力池化技术(vGPU),大模型应用开...
国内火国外冷,Manus遭四重质疑:是技术奇迹还是饥饿营销? 北京时间3月6日凌晨,国内AI技术团队Monica在X平台用英文发布了通用AI Agent——Manus,似乎试图通过“出口转内销”引发“DeepSeek效应”,即先在海外掀起热潮,再席卷国内市场。Manus发布后,大量中文自媒体迅速关注,部分用词还特别夸张——“惊艳全球”“国运级别成就”,热度也迅...