2025 年 7 月 8 日 下午 9:53

李飞飞:高校学生应追逐 AI「北极星」 问题



从开洗衣店谋生、到因学术成就被誉为 「AI 教母」,再到如今成为一家企业的 CEO,李飞飞一直处在 「从零到一」 的历程,并享受其中。用她自己的话来说:

「我喜欢从零开始的感觉,就像站在原点一样。忘记你过去所做的一切,忘记别人对你的看法。只是埋头苦干,努力构建。那是我的舒适区,我就是喜欢那样。」

日前,李飞飞在 Y Combinator 的 AI Startup School 活动上,回顾了 ImageNet 项目的诞生历程、她早期对数据驱动方法的信念,以及卷积神经网络 (CNN)等突破如何催生图像描述、故事生成,最终发展出生成式模型。她还解释了为何 3D 世界建模对通用人工智能 (AGI)至关重要,在她看来,「没有空间智能,AGI 就是不完整的。」

另外在现场,李飞飞还给了身处 AI 时代的硕士、博士研究生一些建议:

  • 寻找那些并非与工业界存在冲突的 「北极星」 问题。学术界,我们仍然可以发现一些真正根本性的问题,而这些问题的解决与你拥有多少芯片无关,你可以取得很大的进展。

  • 跨学科 AI 是学术界一个非常令人兴奋的领域,尤其是在科学发现方面。

  • 带着强烈好奇心攻读研究生的人会真正享受这四年或五年,即使外面的世界以光速流逝。你仍然会感到快乐,因为你正在那里追随那份好奇心。

学术头条在不改变原文大意的情况下,做了简单的编译。内容如下:

一、我的梦想是让机器 「看见」

Diana Hu:我们非常高兴能够邀请到李飞飞博士,她在 AI 领域具有很长的职业生涯,被誉为 「AI 教母」。飞飞,2009 年,也就是 16 年前,你最初创建的项目之一是 ImageNet,引用量已经超过了 8 万次,真正启动了 AI 的 「数据问题」 这一关键支柱。你能和我们谈谈这个项目是如何产生的吗?这在当时可是开创性的工作。

李飞飞:是的,首先感谢 Diana、Gary 和各位邀请我来到这里。我很高兴来到这里,我就像是你们中的一员。我现在也是一名企业家,成立了一家小公司。

说到 ImageNet,我们大约在 18 年前就构思了这个项目,时间过得真快,我当时还是普林斯顿大学的助理教授,那时的 AI 和机器学习世界也与现在大不相同,数据非常少。至少在计算机视觉领域,算法根本无法工作,也没有相关产业,公众甚至不知道 「AI」 这个词。

但我们仍然有一群人,比如 AI 奠基人 John McCarthy、Geoffrey Hinton 等人,一直怀揣着 AI 的梦想。我们真心想制造出能够思考和工作的机器,我个人的梦想是让机器能够 「看见」,因为视觉是智慧的基石,视觉智能不只是简单的感知,实际上是理解世界并在其中行动的能力,所以我痴迷于让机器 「看见」 的问题,并不断开发机器学习算法。我们尝试过神经网络,但它没有奏效。我们转向贝叶斯网络、支持向量机以及其他各种方法。

但总有一个问题困扰着我,那就是泛化能力。如果你从事机器学习工作,那就必须承认泛化是机器学习的核心数学基础或者目标。而算法要实现泛化,就需要数据。但当时在计算机视觉领域,没有人拥有数据。

2007 年左右,我的学生和我决定大胆押注:机器学习需要一场范式转变,而这场转变必须由数据驱动,但当时没有数据。

所以我们想:好吧,那让我们去互联网下载 10 亿张图片,这是我们能在互联网上找到的最大数量,然后创建全球视觉分类体系,用它来训练和测试机器学习算法,这就是 ImageNet 诞生的初衷。

Diana Hu:又过了一段时间,直到 2012 年 AlexNet 出现,才算真正有了起色。这构成了通往 AI 的第二个关键部分:获得计算能力,并投入足够的资源到算法中。请告诉我们,你是从什么时候开始意识到:「数据播种」 方法已经奏效,整个 AI 社区开始取得更多突破性进展。

李飞飞:2009 年,我们还只是在 CVPR 上发表了一张很小的海报,到 2012 年 AlexNet 问世的这三年间,我们坚信数据会驱动 AI,但我们在这方面几乎看不到任何成效。所以我们做了几件事:一是开源,我们从一开始就认为必须将这个项目开放给整个研究社区,让所有人都能参与进来。

另一件事是我们发起了一个挑战赛,也就是 ImageNet 挑战赛,希望全世界最聪明、最优秀的学生和研究人员都能参与解决这个问题。我们每年都会发布一个测试数据集,这个完整的 ImageNet 数据集被用于训练,然后我们公开邀请所有人参与。最初几年实际上是在设定基准线,当时的识别错误率在 30% 左右。它并不是零,我的意思是,它不是完全随机猜测的,但也确实不尽如人意。

直到 2012 年,我仍然记得大概是夏末,我们正在处理 ImageNet 挑战赛的所有结果,并在服务器上运行。在某一天的深夜,我的研究生学生告诉我,我们得到了一个格外突出的结果,让我一定要看看。于是我们研究了它,那是类似卷积神经网络 (CNN)的东西。

当时它还不叫 AlexNet,Geoffrey Hinton 团队将它称为 「Super Vision」,这是对 「超级视觉」 和 「监督学习」 的巧妙运用。CNN 是早在 20 世纪 80 年代就问世的一种算法,他们在这一算法上做了一些调整,但结果让我们惊讶,后来的事情大家都知道了,我们在那年的 ImageNet 挑战赛和意大利佛罗伦萨举办的 ICCV 上展示了这一成果。当时 Alex Krizhevsky 等研究者都来了,我记得杨立昆 (Yann LeCun)也来了。现在,这一刻已经被载入史册,被称为 「ImageNet 挑战赛的 AlexNet 时刻」。这不仅是 CNN 的应用,也是 Alex 和他的团队首次将两个 GPU 并联,用于深度学习的计算。所以,这实际上是数据、GPU 和神经网络首次结合在一起的时刻。

Diana Hu:现在,顺着计算机视觉智能发展的趋势,继 ImageNet 解决了目标识别问题后,紧接着 AI 也开始发展到可以解决场景问题的阶段,对吧?因为你和你的学生,比如 Andrej Karpathy,做了很多让 AI 能够描述场景的工作。请谈谈从物体到场景是如何转变的吧。

李飞飞:是的,ImageNet 解决的核心问题是,当系统接收到一张图片时,能准确识别出其中的物体,比如 「有一只猫」「一把椅子」,诸如此类,这是视觉识别中的基本问题。

自从我进入 AI 领域以来,我就有一个梦想。我认为那是一个需要 100 年去实现的梦想,就是让智能体 (agent)对世界进行故事叙述。想象一下你在这个房间里睁开眼睛时,你看到的不仅仅是人、人、人、椅子、椅子、椅子,而是一个有屏幕、有舞台、有人员、有观众、有摄像头的会议室。你实际上可以描述整个场景,这是人类的一种能力,是视觉智能的基础,对于我们的日常生活至关重要。

所以,我真的认为这个问题会耗费我一生的时间去研究。研究生毕业时,我对自己说,如果能创造出一个能够讲述场景故事的算法,我就成功了,当时我就是这样规划职业生涯的。

AlexNet 出现后,深度学习开始起飞,当 Andrej 以及后来的 Justin Johnson 进入我的实验室后,我们开始观察到自然语言和视觉碰撞的信号,于是 Andrej 和我提出了图像描述或故事讲述的问题。2015 年左右,Andrej 和我发表了一系列论文,这些论文是最早的一批,同期也有几篇类似的研究论文,关于制造一台可以描述图像的计算机。那时我的感受是,天啊,我该怎么度过我的余生?那是我毕生的目标。那对我们俩来说,是一个令人难以置信的时刻。

去年,我在 TED 上做了一个演讲,引用了 Andrej 几年前在完成图像字幕工作时发的一条推文,几乎就是他的毕业论文。我当时还和他开玩笑说:「嘿,Andrej,我们为什么不反过来,拿一句话来生成一张图片呢?」 当然他知道我在开玩笑,说:「哈哈,我可不干,这个世界还没有准备好。」 但现在我们都知道生成式 AI 了,现在我们可以用一句话生成漂亮的图片。我想表达的是,AI 已经经历了不可思议的增长。

我个人觉得我是世界上最幸运的人,因为我的整个职业生涯始于 AI 寒冬结束、AI 热潮开始。我的很多工作,我的职业生涯,都是这个变革的一部分,或者说对这个变革有所帮助。所以我感到非常幸运,也在某种程度上感到自豪。

二、完整的 AGI 离不开 「空间智能」

Diana Hu:我认为最疯狂的是,即使你实现了毕生的梦想——描述一个场景,甚至用扩散模型生成场景,但你实际上还在做更大的梦,因为计算机视觉的整个发展历程从物体变成了场景,再到现在从概念变成了世界。而你决定从学术界教授,转变为现在的 World Labs 创始人和 CEO,请告诉我们,有什么甚至是比看见物体更难的事情。

李飞飞:是的,这的确有点疯狂。当然,过去五六年发生的事情真的很难总结,作为一名计算机视觉科学家,我们见证了计算机视觉正在经历令人难以置信的增长,从图像数据到图像描述,再到使用一些扩散技术的图像生成,这一切都在以一种非常令人兴奋的方式发生。

我们还有另一个极其令人兴奋的领域——语言,也就是现在的 LLM。2022 年 11 月,ChatGPT 打开了真正有效的生成式模型的大门,基本上可以通过图灵测试。因此,这变得非常鼓舞人心,即使对于像我这样年纪的人来说,也能大胆地思考下一步会发生什么。

作为一名计算机视觉科学家,我的很多灵感实际上来自进化以及脑科学。在我的职业生涯中,我发现自己很多时候都在寻找下一个要解决的 「北极星」 问题,我问自己,进化论做了什么?或者大脑发育做了什么?有一些非常值得注意或者值得欣赏的事情是,如果你非常慷慨地算,人类语言在进化中的发展大约花了 3 亿到 5 亿年,还不到 10 亿年,这是人类语言进化所花费的时间长度,而且人类几乎是唯一拥有复杂语言的动物。我们可以争论动物是否具有语言,但实际上,就语言作为沟通、推理、抽象的工具而言,真正完整的语言是属于人类的,这花费的时间还不到 50 万年。

但是,想想视觉,想想理解 3D 世界的能力,弄清楚在这个 3D 世界里该做什么、与 3D 世界互动、理解 3D 世界...... 这个进化过程持续了 5.4 亿年。(5.4 亿年前,第一只三叶虫在水下进化出了视觉感知能力。)从那时起,视觉引发了这场进化的军备竞赛。在视觉出现之前,生物是很简单的,因为在视觉出现之前的 5 亿年里,只有简单的生物。但在接下来的 5.4 亿年里,由于看到世界、理解世界的能力进化,进化竞赛开始了,生物的智力开始相互竞争。

所以对我来说,解决空间智能问题,理解 3D 世界、生成 3D 世界、在 3D 世界中推理、在 3D 世界中做事,是 AI 的基本问题,而且我认为,如果没有空间智能,通用人工智能(AGI)就不完整,我想解决这个问题,这涉及到创建世界模型,超越平面像素、超越语言的世界模型,真正捕捉世界的 3D 结构和空间智能的世界模型。

我一生中最幸运的事情是,无论我多大年纪,我总是能和最优秀的年轻人一起工作,我与三位令人难以置信的、年轻的、世界一流的技术专家 Justin Johnson、Ben Mildenhall 和 Christoph Lassner,共同创办了一家公司,我们即将尝试解决在我看来目前 AI 领域中最困难的问题。

Diana Hu:他们是令人难以置信的人才。我的意思是,Christoph 是 Pulsa(一个开源 3D 场景重建和渲染系统)的创造者。还有你以前的学生 Justin Johnson,他拥有超强的系统工程思维,实现了实时的神经风格迁移。然后是 Ben,他是 NERF 论文的作者。所以,这是一个超级精英团队,而你需要这样一个精干的团队。我们之前稍微聊过,某种程度上,视觉实际上比 LLM 更难。也许这么说有争议,毕竟 LLM 基本上是一维的,但你们谈论的是理解大量的 3D 结构。为什么这么难?而且它仍然落后于语言研究?

李飞飞:是的,Diana,我很感激你能理解我们的问题有多难。语言从根本上说是一维的,对吧?那些音节按照顺序排列,这就是为什么序列到序列,序列建模如此经典。人们没有意识到一些关于语言的东西,语言是纯粹生成性的,自然界中不存在语言。你无法触及语言、无法看见语言,语言实际上是从每个人的头脑中产生的。那是一种纯粹的生成信号。当然,你把它写在纸上,它就在那里。

但是语言的生成、构建和效用是生成性的,现实世界远比这个复杂。首先,真实世界是 3D 的。如果加上时间,就是 4D 的。但我们先将自己限定在空间内,认为它本质上是 3D 的。因此,这本身就是一个组合难度更高的难题。

其次,视觉对世界的感知和接收是一种投射。无论是你的眼睛、视网膜,还是相机,它总是将 3D 转换成 2D,你必须意识到这有多难,这在数学上是错误的。所以这就是为什么人类和动物有多重传感器。然后,你必须解决那个问题。

第三,世界并非纯粹是生成性的。我们可以生成虚拟的 3D 世界,但它仍然必须遵守物理定律以及其他所有规则。现在虚拟世界突然以一种流动的方式在生成和重建之间切换,而且用户行为、效用、用例都非常不同。如果你完全转向生成,我们可以谈论游戏和元宇宙等,如果完全转向现实世界,我们就在谈论机器人技术等,但这一切都处于世界建模和空间智能的连续统一体中。

当然,一个明显的问题是,互联网充斥着大量的语言数据,而空间智能的数据在哪里?它全在我们的脑海里,但它不像语言那样容易获取,这些就是它如此困难的原因。但坦率地说,这让我兴奋,因为如果它很容易,别人早就解决了,我的整个职业生涯都在追逐那些非常困难、近乎妄想的问题,我认为这就是那个妄想问题,感谢你对此的支持。

Diana Hu:甚至从最基本的原理来考虑,人脑的视觉皮层和处理视觉数据的神经元数量远多于处理语言的神经元数量,这如何转化为模型架构?从你发现的情况来看,它与 LLM 非常不同,对吗?

李飞飞:这实际上是一个非常好的问题。现在仍然存在不同的观点,对吧?我们在 LLM 中看到的很多东西实际上都是将 scaling law 应用到理想状态。你几乎可以直接用蛮力进行自监督学习。

而构造性的世界模型可能稍微更细致一些,世界更加结构化,可能存在我们需要用来引导它的信号,你可以称之为先验的形式,也可以称之为数据监督。

无论它是什么,我认为这些都是我们必须解决的一些问题。而且,我们甚至都不能完全理解人类的所有感知。3D 如何在人类视觉中运作仍然是一个未解决的问题。我们从机械角度知道两只眼睛必须对信息进行 3D 测量,但在那之后,数学模型在哪里?

而且人类并不像 3D 动物那么厉害,所以有很多问题需要解答。所以在 World Labs,我只指望一件事,我们之中最聪明的人来解决这个问题。

Diana Hu:World Labs 构建的是全新的基础模型,它输出的是 3D 世界吗?你们设想的应用有哪些?因为我认为你列出了从感知到生成的所有内容,但生成式模型和判别模型之间总是存在这种张力。那么,这些 3D 世界会做什么?

李飞飞:是的,我不能过多地谈论 World Labs 本身的细节。但就空间智能而言,这同样让我感到兴奋。就像语言一样,其用例非常广泛。从创作 (你可以想到设计师、建筑师、工业设计师,以及艺术家、3D 艺术家、游戏开发者)开始,一直到机器人技术、机器人学习。空间智能模型或世界模型的效用真的非常大。然后还有许多相关产业,从营销到娱乐,甚至到元宇宙。

实际上,我对元宇宙感到非常兴奋。我知道很多人觉得它仍然不行,我也知道它仍然不行,但这就是我兴奋的原因。因为我认为硬件和软件的融合即将到来。所以,那也是未来另一个很棒的用例。

Diana Hu:我个人非常高兴你正在解决元宇宙的问题。我在前一家公司尝试过。所以非常高兴你现在正在做这件事。

李飞飞:是的,我认为有更多的信号。我的意思是,我的确认为硬件是障碍的一部分。但你需要内容创作,元宇宙内容创作需要世界模型。

三、喜欢 「从零开始」 的感觉

Diana Hu:让我们稍微换个话题。也许一些听众会觉得你从学术界到现在的创始人兼 CEO 这一转变有些突然。但实际上,你的人生经历非常非凡。这不是你第一次从零到一了,你跟我说过你是如何移民到美国的,在青少年时期,你在一句英语都不会说的情况下,甚至经营过很多年的自助洗衣店。告诉我们所有这些技能是如何塑造你现在的样子的吧。

李飞飞:没错,我确定你们来这里是想听听如何开一家自助洗衣店。

Diana Hu:那是在你 19 岁的时候,对吧?

李飞飞:是的,那时我 19 岁,当时是出于绝望。我没有办法养家糊口,而且我需要去普林斯顿大学读物理学专业,所以我开了一家干洗店。用硅谷的术语来说,我开始筹集资金。

我是创始人兼 CEO,也是收银员和做所有其他事情的人,七年后我离开了。你们真是太好了,我从来没有因为我的自助洗衣店获得过掌声,但谢谢你们。无论如何,我认为 Diana 的观点,尤其是对你们所有人而言,我看着你们,为你们感到非常兴奋,因为你们大概是我年龄的一半,甚至可能是我年龄的 30%,而你们却都如此才华横溢。只管放手去做,不要害怕。

在我整个职业生涯中,我经营过自助洗衣店。但即使作为一名教授,我也做出过选择。我违背了很多建议,选择去了那个我作为首个计算机视觉教授的学院。你知道,作为一名年轻的教授,应该去一个有社群和资深导师的地方。当然,我很乐意有资深导师,但如果他们不在那里,我仍然必须开辟我的道路,闯出我的路,对吧?所以我不害怕那个。

然后我去了谷歌,学习了很多关于谷歌云和 B2B 等方面的商业知识。之后我在斯坦福大学内部创办了一家初创公司。在 2018 年左右,AI 不仅占领了工业界,还成为了一个全人类的问题。人类将始终推动着技术进步,但我们不能失去人性。我非常关心在 AI 的进步中的一些积极导向,并尝试想象 AI 如何以人为本,我们如何创造 AI 来造福人类。

所以,我回到斯坦福大学,创建了斯坦福以人为本人工智能研究院 (HAI)。也许有些人不太理解我在大学里像经营一家初创公司一样经营了五年,但我对此感到非常自豪。在某种程度上,我想我只是喜欢成为一名企业家。

我喜欢从零开始的感觉,就像站在原点一样。忘记你过去所做的一切,忘记别人对你的看法。只是埋头苦干,努力建设。那是我的舒适区,我就是喜欢那样。

Diana Hu:另一个非常酷的事情,除了你所做的所有了不起的事情之外,你还为许多著名研究人员提供建议,比如 Andrew McCarthy、英伟达的 Jim Fan、以及 ImageNet 合著者 Jia Deng,他们后来都拥有了非凡的职业生涯。当他们在学生时代,身上有什么特别之处?

李飞飞:首先,我是幸运的那一个。我认为学生对我而言意义更大,他们真的让我成为一个更好的人,更好的老师,更好的研究者。而且能和这么多有名的学生一起工作,真的是我一生的荣幸。

他们非常不同。他们中的一些人是纯粹的科学家,试图埋头解决科学问题;一些人是行业领袖;一些人是 AI 知识最伟大的传播者。但我认为有一件事将他们团结在一起。

我鼓励他们每个人,你们每个人,都思考这件事。对于那些正在招聘的创始人,这是我的建议,也是我的招聘标准,我寻找的是思想上的无畏

无论你来自哪里,我们试图解决什么问题,都无关紧要。那种勇气,那种拥抱困难的无畏精神,并着手去做,全身心投入,以任何你想要的方式去解决它,这确实是成功人士的核心特征,我从他们身上学到了这一点。作为 World Labs 的首席执行官,我真的在寻找拥有这种品质的年轻人。在我招聘时,我寻找的就是具有这种品质的人。

Diana Hu:所以,你也在为 World Labs 招聘很多人,也在寻找同样的特质,对吧?

李飞飞:是的。我获得了 Diana 的许可,可以宣布我们正在招聘。我们正在招聘工程人才、产品人才、3D 人才、生成式模型人才。所以,如果你觉得自己无所畏惧,并且对解决空间智能充满热情,请与我联系或访问我们的网站。

四、AI 时代,给学生的一些建议

观众:二十多年前,你从事过视觉识别方面的工作。如果我现在开始我的博士生涯,我应该研究什么才能像你一样成为传奇人物?

李飞飞:虽然我可以说,做任何让你兴奋的事,但我更想给你一个深思熟虑的答案。首先,我认为 AI 研究已经改变,因为如果你要开始攻读博士学位,那么你就在学术界,而学术界不再拥有大部分的 AI 资源,这和我的时代非常不同。就资源而言,学术界的计算能力和数据量确实非常匮乏。还有一些问题,工业界可以更快地解决。

如果你是一名博士生,我建议你寻找那些并非与工业界存在冲突的 「北极星」 问题,工业界能够利用更好的计算能力、更好的数据和团队科学来更好地解决这些冲突问题。但在学术界,我们仍然可以发现一些真正根本性的问题,而这些问题的解决与你拥有多少芯片无关,你可以取得很大的进展。

其次,对我而言,跨学科 AI 是学术界一个非常令人兴奋的领域,尤其是在科学发现方面,有太多的学科可以与 AI 交叉,我认为这是一个可以深入研究的巨大领域。

在理论方面,AI 的能力已经完全超越了理论,这令人着迷,我们没有可解释性,不知道如何弄清楚因果关系。模型中仍有很多我们不理解的东西,可以继续推进研究。

而且这个列表还可以继续列下去。在计算机视觉中,仍然存在我们尚未解决的表征问题。另外,小数据也是一个非常有趣的领域。所以,这些都是可能性。

观众:看到一位女性在这个领域发挥主导作用真的很鼓舞人心。作为一名研究员、教育者和企业家,我想问一下,你认为在 AI 迅速崛起的时代,什么样的人适合攻读研究生?

李飞飞:这是个很好的问题,甚至连家长们都会问我这个问题。我认为研究生阶段是让你拥有强烈求知欲的四五年。你被好奇心所引导,而且这种好奇心如此强烈,以至于没有其他更好的地方可以做到这一点。

这与创业公司不同,因为你必须稍微小心一点,创业公司不能仅仅由好奇心驱动,你的投资者会因此对你感到不满。创业公司拥有更专注的商业目标,其中一部分是好奇心,但不仅仅是好奇心。

然而,解决问题或提出正确问题的这种好奇心非常重要,我认为那些带着强烈好奇心攻读研究生的人会真正享受这四年或五年,即使外面的世界以光速流逝。你仍然会感到快乐,因为你正在那里追随那份好奇心。

五、其他 QA:关于 AGI、开源

观众:在你看来,AGI 更有可能作为一个单一的统一模型出现,还是作为一个多智能体系统出现?

李飞飞:你提问的方式本身就包含了两种定义。其中一种定义更偏理论性,也就是将 AGI 定义为通过某种智商测试来判定。你问题的另一半则更偏实用主义,如果是基于智能体的系统,它是否具有功能性?它能完成哪些任务?

老实说,我很难接受这种 AGI 的定义。原因如下:1956 年在达特茅斯学院聚首的 AI 之父们,比如 John McCarthy 和 Marvin Minsky,试图解决的是机器思考的问题。而 Alan Turing 比他们早 10 年左右提出了这个问题。这种说法不是狭义的 AI,而是对智能的陈述。

所以,我不太清楚如何区分 AI 最初的问题和 AGI 这个新词。对我来说,它们的本质相同。但我明白,现在的行业喜欢提 AGI,好像它超越了 AI。我对此感到困惑,因为我不知道 AGI 到底和 AI 有什么不同。如果我们说今天的类 AGI 系统比 70、80、90 年代或任何时候更狭隘的 AI 系统表现更好,我表示赞同。但从根本上讲,我认为 AI 的科学就是智能的科学,就是创造出能够像人类一样,甚至比人类更智能地思考和做事的机器。

所以,我不知道如何定义 AGI,我不知道在没有定义它的情况下,它是否是单一的 (系统)。如果你看大脑,你可以称它为单一的 (系统),但它确实有不同的功能,有布若卡氏区负责语言,有视觉皮层、运动皮层。这个问题很难回答。

观众:你提到开源是 ImageNet 增长的重要组成部分。而现在,随着 LLM 的最新发布和增长,我们已经看到各组织在开源方面采取了不同的方法,一些组织完全保持闭源,一些组织完全发布其整个研究堆栈,一些组织则介于两者之间,部分开源 (如权重开源但许可证受限)等,以及诸如此类的性质。所以我想问一下,你如何看待这些不同的开源方法,以及你认为作为一家 AI 公司,进行开源的正确方式是什么?

李飞飞:我认为当存在不同的方法时,生态系统才是健康的。我在开源或闭源方面,并不持 「你必须开源或你必须闭源」 的态度,这取决于公司的商业战略。

举例来说,为什么 Meta 想要开源,很明显对吧?他们现在的商业模式还不是销售模型,他们用它来发展生态系统,以便人们来到他们的平台。因此,开源很有意义。

而其他通过货币化来盈利的公司,你可以考虑开源和闭源。所以我对这些都持开放态度。从更高的层面来说,我认为开源应该受到保护。如果在开源方面有努力,无论是在公共部门,如学术界,还是在私营部门,这都非常重要,对于创业生态系统至关重要。这对于公共部门至关重要,我认为应该受到保护。不应受到惩罚。

访谈链接:https://www.youtube.com/watch?v=_PioN-CpOP0&t=742s&ab_channel=YCombinator

本文来自微信公众号:学术头条,整理:小瑜

- Advertisement -spot_img

推荐阅读