新华财经北京 6 月 2 日电 5 月,全球多家科技公司发布新的大模型,它们在语义理解、多模态等方面进一步提升,人工智能 (AI) 的能力边界在不断扩大。随着无人驾驶、机器人等技术借助 AI 快速进化并逐步投入市场,不少国家通过推进法规建设、开展国际合作等方式,为 AI 领域创新提供更好的土壤。
大模型更趋实用化
5 月下旬,中国深度求索 (DeepSeek) 公司表示,DeepSeek R1 模型已完成小版本升级,当前版本为 DeepSeek-R1-0528,模型的思维深度与推理能力显著提升。更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。
同样在 5 月,美国 Anthropic 公司推出 「克劳德 4」 系列两款新模型:「奥普斯 4」(Opus 4) 与 「十四行诗 4」(Sonnet 4),旨在为业界提供更高标准的编程、推理和智能体应用。Opus 4 是行业领先的编程模型,能够高效完成复杂且持续时间长的任务;而 Sonnet 4 在此前的 3.7 版本基础上显著升级,具备更强的指令理解能力与推理、编程表现。
行业巨头谷歌公司也没闲着。该公司在 5 月推出整体性能和智能推理能力均较以往版本大幅提升的多个 「双子座 2.5」 系列模型,并发布了多个多模态模型,如图像生成模型 Imagen 4 和视频生成模型 Veo 3,具备从文本等多种输入形式生成高质量视觉内容的能力。音乐生成模型 Lyria 2 为音乐人提供了多模态创作工具。AI 电影制作工具 Flow 集成了先进的多模态技术,使用户通过自然语言描述就能生成高质量的视觉作品。
AI 仍有不少缺陷需克服
尽管当前 AI 应用已相当广泛,但不少缺陷还是会影响其实用性。研究人员正努力分析导致这些缺陷的原因并寻求新的解决方法,从而改善 AI 的性能。
一个比较明显的问题是,AI 生成内容虽然已非常流畅,但提供的信息很多时候还是不准确。5 月,日本研究人员在德国 《先进科学》 杂志发表的一项研究成果中指出,这一问题与人类的语言障碍——失语症类似。
据研究人员介绍,大模型在出现严重错误时仍表达流畅,这与感觉性失语症的症状有相似之处,即说话流利却总说不出什么意思。这并不意味着 AI 聊天机器人有 「脑损伤」,但它们可能被锁定在一种僵化的内部模式中,限制其灵活运用所储存知识,就像患了感觉性失语症。未来研究人员可以针对相关问题,找到改善措施。
业界也确实在努力从不同角度去寻求优化大模型的解决方案。中国科学院自动化研究所联合鹏城实验室提出了一种高效推理策略 AutoThink,可让大模型实现自主切换思考模式,避免 「过度思考」。
据研究人员介绍,AutoThink 提供了一种简单而有效的推理新范式——通过省略号提示配合三阶段强化学习,引导大模型不再 「逢题必深思熟虑」,而是根据问题难度自主决定 「是否思考」「思考多少」。在多个数学数据集上,AutoThink 实现了准确率与效率平衡,既提升性能又节省算力,展示出较强的适应性和实用性。
营造更合理的 AI 创新环境
国际劳工组织 5 月 20 日发布一份有关生成式 AI 与就业的报告表示,全球四分之一的工作岗位可能受到生成式 AI 影响。不过报告也指出,在劳动领域,生成式 AI 本身并无好坏之分,其社会经济影响在很大程度上取决于对技术普及的管理方式。
一些国家已在积极尝试通过优化政策、法规来营造更好的 AI 创新环境。日本参议院全体会议 5 月 28 日以多数赞成票通过该国首部专门针对 AI 的法律,旨在促进 AI 相关技术研发和应用并防止其滥用。依据这部 《人工智能相关技术研究开发及应用推进法》,日本拟设立以日本首相为首、全体内阁成员参加的 「AI 战略本部」 作为日本 AI 政策的 「司令部」,并制定 「AI 基本计划」。
国际合作同样重要。「2025 中国—上海合作组织人工智能合作论坛」5 月 29 日在天津召开。论坛发布 《中国—上合组织国家人工智能应用合作中心建设方案》,邀请上合组织成员国共建人工智能应用合作中心,围绕夯实人工智能发展基础、提供开源开放服务、加强产业合作对接、促进人才培育等方面加强务实合作,共同促进人工智能技术普惠应用。
编辑:王姝睿
声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115