75
0每经记者 赵雯琪每经编辑 杨夏 发布千亿参数模型Yi-Large 5个月后,零一万物创始人兼CEO李开复再次带着新产品公开亮相。 10月16日,零一万物正式发布了新的预训练模型Yi-Lightning(直译为闪电模型)。选择在此时 ...
|
每经记者 赵雯琪 每经编辑 杨夏 发布千亿参数模型Yi-Large 5个月后,零一万物创始人兼CEO李开复再次带着新产品公开亮相。 10月16日,零一万物正式发布了新的预训练模型Yi-Lightning(直译为闪电模型)。选择在此时发布新产品,或许是为了用实际行动回应市场猜测。前段时间,国内大模型创业公司“六小虎”(智谱AI、百川智能、零一万物、月之暗面、Minimax、阶跃星辰)均受到不同程度的质疑,零一万物更是被直指放弃了预训练。 对此,零一万物创始人兼CEO李开复在新品发布后接受包括《每日经济新闻》记者在内的媒体采访时表示,零一万物绝不会放弃预训练模型工作。值得一提的是,在To B(企业端)战略下,零一万物首次发布了针对零售和电商等场景的行业应用产品AI 2.0数字人,并已在弹幕互动、商品信息提取、实时话术生成等环节接入了Yi-Lightning。 进入2024年,中国大模型行业从狂奔进入到了“长跑阶段”。从技术侧和产业侧都引发了行业的进一步思考,头部企业也开始探索更多商业化方向。今年8月,月之暗面创始人杨植麟开始将一部分精力放到B端业务上,他们正式发布了Kimi企业级API,以探索在B端的商业模式。百川智能则与国家儿童医学中心北京儿童医院签署战略合作协议,双方计划共同推出“一大四小”五款AI医疗产品。 李开复表示,中国大模型产业进入到了“耐力赛”阶段,如何让大模型赋能千行百业,提升企业新质生产力是一个重要的命题。这不仅将牵涉到“大模型+行业”的未来发展方向,甚至会影响世界的创新版图。 预训练成本一次三四百万美金 “但零一万物绝不会放弃”据李开复分享,在LMSYS盲测竞技场总榜(用户对一组大模型回答进行盲投的榜单)上,零一万物最新发布的Yi-Lightning位列第六,仅次于OpenAI的GPT-4o、o1系列,以及Google的Gemini 1.5 pro系列,并且与马斯克xAI旗下Grok-2打平。这是中国大模型厂商目前在该榜单上取得的最好成绩。 而这个新预训练模型的发布,也是李开复对于“零一万物放弃预训练”市场传言的回击。 他表示,GPT新发布o1之后,给零一万物团队带来了新灵感,“一年半以前大家觉得大模型最厉害的地方就是预训练,一年以后发现Post train(后训练)也是同样重要,感谢OpenAI点醒我们这一点。”不过,李开复提到,后训练的重要性变高,不代表要彻底放弃预训练。 根据公开信息,大模型预训练是在大规模数据集上进行的初步训练,旨在让模型学习通用的语言知识和模式。而后训练则是在预训练的基础上,针对特定任务进行的进一步优化和调整,以使模型在该任务上表现更加出色。 李开复表示,他认为做好预训练模型是一个技术活,而且是要非常多有才华的人在一起工作,慢工出细活,需要有懂芯片的人,懂推理的人,懂基础架构的人,懂模型的人,有很好的算法同学,一起做出来。不过他也坦言,不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后可能会越来越少的大模型公司做预训练。他明确表态,零一万物绝不放弃预训练。 《每日经济新闻》记者也发现,今年以来,有一批大模型公司停下了研发的脚步。据经济观察网统计,截至2024年10月9日,在188个通过网信办生成式人工智能备案的大模型中,超过三成的大模型在通过备案后未进一步公开其进展情况,仅有约一成的大模型仍在加速训练,接近一半的大模型转向了AI应用的开发。 据李开复透露,做预训练的Production Run(投产运行)的训练成本是一次三四百万美金。“‘六小虎’的融资额度都是够的,这个钱也是头部公司都付得起。我觉得中国的六家大模型公司只要有够好的人才,如果有想做预训练的决心,资金和芯片算力都不是问题。”李开复表示。 将在国内寻找ToB商业空间 在海外侧重C端产品值得一提的是,创业一年,李开复也带领零一万物也开始加速探索商业化落地和更多赚钱的机会。
图片来源:直播截图 |
顶部
发布