• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
晋升业内新宠儿,MoE模型给了AI行业两条关键出路

晋升业内新宠儿,MoE 模型给了 AI 行业两条关键出路

2024 年 7 月 12 日
生成式AI应用破解跨境电商本地化翻译难题:1个月上线,翻译成本减少40% | 创新场景

聚焦有色产业 共探期货服务实体新路径

2025 年 9 月 11 日
供给端压力再度回升 纯碱价格上行驱动或不足

AI Godfather Reveals ChatGPT's Involvement in his Breakup With Ex-girlfriend

2025 年 9 月 11 日
28家上市券商「发红包」:拟中期分红188亿元;投研老将徐志敏告别中泰资管 | 券商基金早参

半导体、CRO 概念股走强,科创成长 50ETF(588020)、科创板 50ETF(588080) 等助力布局优质科创企业

2025 年 9 月 11 日
黄金9995价格多少钱一克(2025年09月01日)

收评:沪指涨 0.13% 创业板指涨 1.27% 通信设备及油气开采板块涨幅靠前

2025 年 9 月 11 日
【商务部新闻发言人就对原产于美国的进口相关光纤产品反规避调查裁决答记者问】2025年3月4日,应中国国内企业申请,商务部对原产于美国的进口相关截止波长位移单模光纤产品发起反规避调查。该案是中国首起反规避调查。立案后,商务部依法依规开展了调查,调查程序公开透明,充分保障了各利害关系方的权利。经过调查,证据显示,美国出口商通过对华出口相关截止波长位移单模光纤,规避了中国对美非色散位移单模光纤产品的反倾销措施。根据调查结果,商务部发布公告,决定自2025年9月4日起实施反规避措施。

特朗普称愿意对中印大幅加征关税,外交部回应

2025 年 9 月 11 日
在上游高供给压力下 碳酸锂短期或震荡偏弱运行

在上游高供给压力下 碳酸锂短期或震荡偏弱运行

2025 年 9 月 11 日
生成式AI应用破解跨境电商本地化翻译难题:1个月上线,翻译成本减少40% | 创新场景

金至尊铂金多少钱一克 (2025 年 09 月 05 日) 参考价格

2025 年 9 月 11 日
科创板收盘播报:科创50指数跌1.64% 电气设备股表现活跃

91 万就业数据一夜蒸发!美财长、白宫逼宫美联储:必须立刻降息

2025 年 9 月 11 日
隆基绿能:主业盈亏平衡时间点推迟到Q4  提高BC二代产品是主要目标|直击业绩会

我国海洋生产总值去年突破 10 万亿元

2025 年 9 月 11 日
「400万辆是生死线」,零跑出海给中国车企指了一条新路|钛度车库

「400 万辆是生死线」,零跑出海给中国车企指了一条新路|钛度车库

2025 年 9 月 11 日
放下身段,拥抱主流:方程豹钛7的「务实」转型

放下身段,拥抱主流:方程豹钛 7 的 「务实」 转型

2025 年 9 月 11 日
市场实际成交不活跃 尿素短期低位整理

港股券商板块交投活跃,香港证券 ETF(513090) 昨日 「吸金」 超 10 亿元,净流入额居全市场 ETF 首位

2025 年 9 月 11 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 11 日 星期四
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 24 小时

晋升业内新宠儿,MoE 模型给了 AI 行业两条关键出路

1 年 之前
在 24 小时
阅读时间: 1 mins read
0 0
A A
晋升业内新宠儿,MoE模型给了AI行业两条关键出路


文 | 智能相对论,作者 | 陈泊丞

今年以来,MoE 模型成了 AI 行业的新宠儿。

一方面,越来越多的厂商在自家的闭源模型上采用了 MoE 架构。在海外,OpenAI 的 GPT-4、谷歌的 Gemini、Mistral AI 的 Mistral、xAI 的 Grok-1 等主流大模型都采用了 MoE 架构。

而在国内,昆仑万维推出的天工 3.0、浪潮信息发布的源 2.0-M32、通义千问团队发布的 Qwen1.5-MoE-A2.7B、MiniMax 全量发布的 abab6、幻方量化旗下的 DeepSeek 发布的 DeepSeek-MoE 16B 等等也都属于 MoE 模型。

另一方面,在 MoE 模型被广泛应用的同时,也有部分厂商争先开源了自家的 MoE 模型。前不久,昆仑万维宣布开源 2 千亿参数的 Skywork-MoE。而在此之前,浪潮信息的源 2.0-M32、DeepSeek 的 DeepSeek-MoE 16B 等,也都纷纷开源。

为什么 MoE 模型如此火爆,备受各大厂商的青睐?在开源的背后,MoE 模型又是以什么样的优势使各大主流厂商成为其拥趸,试图作为改变 AI 行业的利器?

MoE 模型火爆的背后:全新的 AI 解题思路

客观来说,MoE 模型的具体工作原理更接近中国的一句古语 「术业有专攻」,通过把任务分门别类,然后分给多个特定的 「专家」 进行解决。

它的工作流程大致如此,首先数据会被分割为多个区块 (token),然后通过门控网络技术 (Gating Network) 再把每组数据分配到特定的专家模型 (Experts) 进行处理,也就是让专业的人处理专业的事,最终汇总所有专家的处理结果,根据关联性加权输出答案。

当然,这只是一个大致的思路,关于门控网络的位置、模型、专家数量、以及 MoE 与 Transformer 架构的具体结合方案,各家方案都不尽相同,也逐渐成为各家竞争的方向——谁的算法更优,便能在这个流程上拉开 MoE 模型之间的差距。

像浪潮信息就提出了基于注意力机制的门控网络 (Attention Router),这种算法结构的亮点在于可以通过局部过滤增强的注意力机制 (LFA, Localized Filtering-based Attention),率先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确,从而更好地匹配专家模型,保证了专家之间协同处理数据的水平,促使模型精度得以提升。

 

基于注意力机制的门控网络 (Attention Router)

抛开目前各家厂商在算法结构上的创新与优化不谈,MoE 模型这种工作思路本身所带来的性能提升就非常显著——通过细粒度的数据分割和专家匹配,从而实现了更高的专家专业化和知识覆盖。

这使得 MoE 模型在处理处理复杂任务时能够更准确地捕捉和利用相关知识,提高了模型的性能和适用范围。因此,「智能相对论」 尝试了去体验天工 3.0 加持的 AI 搜索,就发现对于用户较为笼统的问题,AI 居然可以快速的完成拆解,并给出多个项目参数的详细对比,属实是强大。

 

天工 AI 搜索提问 「对比一下小米 su7 和特斯拉 model3」 所得出的结果

由此我们可以看到,AI 在对比两款车型的过程中,巧妙地将这一问题拆解成了续航里程、动力性能、外观设计、内饰设计、智能化与自动驾驶、市场表现与用户口碑、价格等多个项目,分别处理得出较为完整且专业的答案。

这便是 「术业有专攻」 的优势——MoE 模型之所以受到越来越多厂商的关注,首要的关键就在于其所带来的全新解决问题的思路促使模型的性能得到了较为显著的提高。特别是伴随着行业复杂问题的涌现,这一优势将使得 MoE 模型得到更广泛的应用。

各大厂商争先开源 MoE 模型:解决 AI 算力荒的另一条路径

抛开性能来说,MoE 模型更突出的一点优势则在于算力效率的提升。

DeepSeek-MoE 16B 在保持与 7B 参数规模模型相当的性能的同时,只需要大约 40% 的计算量。而 37 亿参数的源 2.0-M32 在取得与 700 亿参数 LLaMA3 相当性能水平的同时,所消耗的算力也仅为 LLaMA3 的 1/19。

也就意味着,同样的智能水平,MoE 模型可以用更少的计算量和内存需求来实现。这得益于 MoE 模型在应用中并非要完全激活所有专家网络,而只需要激活部分专家网络就可以解决相关问题,很好避免了过去 「杀鸡用牛刀」 的尴尬局面。

举个例子,尽管 DeepSeek-MoE 16B 的总参数量为 16.4B,但每次推理只激活约 2.8B 的参数。与此同时,它的部署成本较低,可以在单卡 40G GPU 上进行部署,这使得它在实际应用中更加轻量化、灵活且经济。

在当前算力资源越来越紧张的 「算力荒」 局面下,MoE 模型的出现和应用可以说为行业提供了一个较为现实且理想的解决方案。

更值得一提的是,MoE 模型还可以轻松扩展到成百上千个专家,使得模型容量极大增加,同时也允许在大型分布式系统上进行并行计算。由于各个专家只负责一部分数据处理,因此在保持模型性能的同时,又能显著降低了单个节点的内存和计算需求。

如此一来,AI 能力的普惠便有了非常可行的路径。这样的特性再加上厂商开源,将促使更多中小企业不需要重复投入大模型研发以及花费过多算力资源的情况下便能接入 AI 大模型,获取相关的 AI 能力,促进技术普及和行业创新。

当然,在这个过程中,MoE 模型厂商们在为市场提供开源技术的同时,也有机会吸引更多企业转化成为付费用户,进而走通商业化路径。毕竟,MoE 模型的优势摆在眼前,接下来或许将有更多的企业斗都会尝试新的架构来拓展 AI 能力,越早开源越能吸引更多市场主体接触并参与其中。

但是,开源最关键的优势还是在于 MoE 模型对当前算力问题的解决。或许,随着 MoE 模型被越来越多的企业所接受并应用,行业在获得相应 AI 能力的同时也不必困顿于算力资源紧张的问题了。

写在最后

MoE 大模型作为当前人工智能领域的技术热点,其独特的架构和卓越的性能为人工智能的发展带来了新的机遇。不管是应用还是开源,随着技术的不断进步和应用场景的不断拓展,MoE 大模型有望在更多领域发挥巨大的潜力。

MoE 模型的本质在于为 AI 行业的发展提供了两条思路,一是解决应用上的性能问题,让 AI 有了更强大的解题思路。二是解决算力上的欠缺问题,让 AI 有了更全面的发展空间。由此来看 MoE 模型能成为行业各大厂商的宠儿,也是水到渠成的事情。



猜您喜欢

影响市场重大事件:陈茂波表态,稳定币有望为资本市场带来变革,把稳定币应用推广至不同场景

马斯克才是 「最大隐患」?知名特斯拉投资者:他应在公众视线中消失一年!

2 月 之前
0

【财经面对面】「东数」 如何 「西算」——新疆克拉玛依市委常委张煜谈如何打造算力新城

2 月 之前
0

相关 文章

生成式AI应用破解跨境电商本地化翻译难题:1个月上线,翻译成本减少40% | 创新场景
24 小时

聚焦有色产业 共探期货服务实体新路径

8 分 之前

【文章来源:期货日报】2025 有色金属期现货市场产融结合在线研讨会开启 为进一步推动有色金属期现货市场产融深度结合,中期协联合中国有色金属工业协会、上期所、广...

供给端压力再度回升 纯碱价格上行驱动或不足
期货市场

AI Godfather Reveals ChatGPT's Involvement in his Breakup With Ex-girlfriend

10 分 之前

TMTPOST -- Geoffrey Hinton, the pioneering computer scientist often dubbed the 「...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

生成式AI应用破解跨境电商本地化翻译难题:1个月上线,翻译成本减少40% | 创新场景

聚焦有色产业 共探期货服务实体新路径

2025 年 9 月 11 日
供给端压力再度回升 纯碱价格上行驱动或不足

AI Godfather Reveals ChatGPT's Involvement in his Breakup With Ex-girlfriend

2025 年 9 月 11 日
28家上市券商「发红包」:拟中期分红188亿元;投研老将徐志敏告别中泰资管 | 券商基金早参

半导体、CRO 概念股走强,科创成长 50ETF(588020)、科创板 50ETF(588080) 等助力布局优质科创企业

2025 年 9 月 11 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录