模型的相关文章 - 尚趣网 - 第5页

效率跃升1.71倍，字节再降MoE训练成本，为何AI玩家接连开源最新技术？

训练大模型的成本之高一直是行业痛点，各路玩家都在思考如何用技术创新把成本“打”下来。3月10日，字节跳动豆包大模型团队发布了针对MoE（混合专家模型）架构的通信优化系统COMET，该方案通过细粒度计算-通信重叠技术，助力大模型训练优化。据豆包大模型团队介绍，COMET已实际应用于万卡级生产集群，累计...

快手-W早盘涨6%！花旗：维持“买入”评级，可灵大模型视频模型名列前茅，视为快手在人工智能领域不错切入点

快手-W（01024）早盘持续走高，股价上涨5.86%，现报66.80港元，成交额31.45亿港元。近日，花旗发布研报称，维持快手-W（01024）“买入”评级，目标价67港元。快手股价周四（6日）上涨超过13%，该行认为潜在受惠于今年中国政府工作报告中承诺支持人工智能，加上中央官员在记者会上提及“...

A股午评：三大指数弱势调整，军工股逆势活跃，白酒股走强！超4000股下跌，成交额9488亿缩量558亿；机构解读

3月11日消息，指数早盘弱势调整，创指、深成指盘中一度翻红后回落。板块方面，军工板块早盘强势，火炬电子(603678)、炼石航空(000697)、内蒙一机(600967)等涨停；白酒股震荡走强，山西汾酒(600809)、古井贡酒(000596)涨幅居前；国资云概念活跃，美利云(000815)、湖北广...

智元发布首个通用具身基座大模型GO-1

每经AI快讯，3月10日，据智元机器人官方公众号消息，“稚晖君”创业项目智元机器人今日发布了首个通用具身基座模型——智元启元大模型（GenieOperator-1），它开创性地提出了Vision-Language-Latent-Action（ViLLA）架构，该架构由VLM（多模态大模型）+MoE（...

智元发布首个通用具身基座大模型：完成小样本快速泛化，降低具身智能门槛

3月10日，智元发布首个通用具身基座大模型——智元启元大模型（GO-1）。据了解，该架构由VLM（多模态大模型）+MoE（混合专家）组成。其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，MoE中的Latent Planner（隐式规划器）借助大量跨本体和人类操作数据获得通用的动作理解...

太突然！“计划有变，他不去了”！火爆出圈的明星公司，90后创始人取消武汉亮相

市场消息称，Manus创始人肖弘周二（3月11日）或将在武汉公开演讲，参与超擎数智协办的2025 NVIDIA创业企业展示武汉站活动，这可能是Manus出圈后创始人的第一次亮相。3月10日，Manus团队方面向《每日经济新闻》记者回应称，计划有变，他不去了。肖弘。图片来源：极目新闻援引点石创校公众号...

华为离职天才少年“稚晖君”放大招训练机器人的大模型来了

凤凰网科技讯 3月10日，前华为天才少年“稚晖君”创业项目智元机器人今日发布首个通用具身基座模型——智元启元大模型（Genie Operator-1）。该模型提出了Vision-Language-Latent-Action (ViLLA) 架构，该架构由VLM(多模态大模型) + MoE(混合专家)...

国家超算互联网平台接入阿里千问大模型

格隆汇3月10日｜据全天候科技，国家超算互联网平台接入阿里巴巴通义千问大模型，对外提供千问QwQ-32B API服务，用户可免费获得100万 tokens。据了解，千问QwQ-32B是阿里通义团队最新开源(300109)的推理模型，在数学、代码及通用能力的多项权威评测集中，表现与“满血版”671B的...

第四范式：联合华为发布SageOne IA一体机

新浪科技讯 3月9日晚间消息，第四范式日前宣布联合华为昇腾AI升级发布SageOne IA一体机解决方案，在支持DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型的基础上，企业可灵活在满血版和多个蒸馏模型之间切换。据悉，该方案中集成了智能算力池化技术（vGPU），大模型应用开...

国内火国外冷，Manus遭四重质疑：是技术奇迹还是饥饿营销？

北京时间3月6日凌晨，国内AI技术团队Monica在X平台用英文发布了通用AI Agent——Manus，似乎试图通过“出口转内销”引发“DeepSeek效应”，即先在海外掀起热潮，再席卷国内市场。Manus发布后，大量中文自媒体迅速关注，部分用词还特别夸张——“惊艳全球”“国运级别成就”，热度也迅...