• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
相关技术突破不断 机构称脑机接口市场前景可期

DeepSeek 论文登上 《自然》 杂志 首次披露训练 R1 成本

2025 年 9 月 18 日
钌回收价格多少钱一克(2025年09月01日)

万科组织架构调整

2025 年 9 月 18 日
港股收盘 | 科技指数涨超4% 领跑主要指数 锂电和芯片股延续强势

港股收盘 | 科技指数涨超 4% 领跑主要指数 锂电和芯片股延续强势

2025 年 9 月 18 日
原子能法草案拟提请三审

中信证券:看好白酒行业底部配置机会

2025 年 9 月 18 日
我们还是低估了英伟达

我们还是低估了英伟达

2025 年 9 月 18 日
pt999铂金回收价格今日多少钱一克(2025年09月01日)

市场库存继续累库 预计豆粕短期重心将下移

2025 年 9 月 18 日
18K金价格多少钱一克(2025年09月01日)

石家庄周大福黄金价格今天多少一克 (2025 年 9 月 17 日)

2025 年 9 月 18 日
半导体设备年会将至,新凯来将参加,科创半导体ETF(588170)获资金逆势加仓

人民银行将在香港发行 600 亿元央行票据

2025 年 9 月 18 日
化工龙头ETF(516220)涨超2%,机构:行业景气回暖与供给侧优化共振

高盛:美股新高,中国股市吸金,投资者已不信欧洲画的 「大饼」

2025 年 9 月 18 日
禾赛「回港」,预料之中的资本转身

禾赛 「回港」,预料之中的资本转身

2025 年 9 月 18 日
万字长文 | AI落地的十大问题

万字长文 | AI 落地的十大问题

2025 年 9 月 18 日
化工龙头ETF(516220)涨超2%,机构:行业景气回暖与供给侧优化共振

ETF 今日收评 | 恒生互联网科技 ETF 涨超 5%,港股创新药、黄金股相关 ETF 跌幅居前

2025 年 9 月 18 日
欧洲量子计算独角兽诞生:IQM已完成3.2亿美元融资

科技股攻势如潮,沪指半日涨 0.45% 逼近 3900 点

2025 年 9 月 18 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 18 日 星期四
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 外汇动态

DeepSeek 论文登上 《自然》 杂志 首次披露训练 R1 成本

3 小时 之前
在 外汇动态
阅读时间: 1 mins read
0 0
A A
相关技术突破不断 机构称脑机接口市场前景可期

猜您喜欢

AMD CEO称全球数据中心AI加速器市场将高速增长 2028年超过5000亿美元

AMD CEO 称全球数据中心 AI 加速器市场将高速增长 2028 年超过 5000 亿美元

3 月 之前
0
特斯拉二季度交付的电动汽车 超7成在中国和美国市场

特斯拉二季度交付的电动汽车 超 7 成在中国和美国市场

2 月 之前
0


【天顺财经】9 月 18 日消息,据外媒报道,AI 初创公司 DeepSeek(深度求索) 的论文登上 《自然》 杂志。

DeepSeek 表示其强大的 AI 模型 R1 的成功并非依赖于模仿其他大型语言模型 (LLM) 生成的示例进行训练,这一声明是随着 R1 模型的同行评审版本的发布而公布的。

论文描述了 DeepSeek 如何增强标准的大型语言模型以应对推理任务,其补充材料首次揭示了训练 R1 的成本:仅为 29.4 万美元。这不包括 DeepSeek 公司在开发 R1 所基于的基础 LLM 上花费的约 600 万美元,但总成本仍然远低于竞争对手模型被认为花费的数千万美元。

DeepSeek 表示,R1 主要使用英伟达的 H800 芯片进行训练。

R1 被认为是第一个经过同行评审过程的主要 LLM。「这是一个非常受欢迎的先例」,Hugging Face 的机器学习工程师刘易斯·图恩斯特尔说,他审阅了 《自然》 杂志的论文。「如果我们没有公开分享这一过程的大部分内容,就很难评估这些系统是否构成风险。」

自 1 月发布以来,DeepSeek 因其与世界领先的 AI 应用相比,竞争优势明显、成本低廉而备受赞誉和关注。Sensor Tower 称,DeepSeek 推出的应用在最初的 18 天内获得了 1600 万次下载,几乎是 OpenAI 的 ChatGPT 首次发布时 900 万次下载量的两倍。

公开资料显示,DeepSeek 成立于 2023 年 7 月,由知名量化资管巨头幻方量化创立,专注于开发先进的大语言模型 (LLM) 和相关技术。幻方量化的掌门人梁文锋是 DeepSeek 的创始人。

相关 文章

钌回收价格多少钱一克(2025年09月01日)
行业新闻

万科组织架构调整

6 分 之前

https://www.huxiu.com/article/4781411.html

港股收盘 | 科技指数涨超4% 领跑主要指数 锂电和芯片股延续强势
24 小时

港股收盘 | 科技指数涨超 4% 领跑主要指数 锂电和芯片股延续强势

14 分 之前

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

钌回收价格多少钱一克(2025年09月01日)

万科组织架构调整

2025 年 9 月 18 日
港股收盘 | 科技指数涨超4% 领跑主要指数 锂电和芯片股延续强势

港股收盘 | 科技指数涨超 4% 领跑主要指数 锂电和芯片股延续强势

2025 年 9 月 18 日
原子能法草案拟提请三审

中信证券:看好白酒行业底部配置机会

2025 年 9 月 18 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录