“振翅”飞机公司谈AI未来：“我们要尝试真正颠覆性的创新”_健康综合_生活日常_切尔网

　　 “振翅”飞机公司谈AI未来：“我们要尝试真正颠覆性的创新”

　　【编者按】在AI浪潮席卷全球的今天，当大多数实验室仍在为“数据饥渴”的大模型投入巨资时，一家名为“振翅飞机”（Flapping Airplanes）的新锐实验室却选择了一条截然不同的道路——他们坚信，人工智能的未来不在于吞噬更多数据，而在于像人类一样高效学习。这家由三位年轻创始人领衔的实验室，凭借其颠覆性的理念，竟一举获得1.8亿美元的天使轮融资，震动业界。他们不追求复刻鸟类（人脑），而是要造出“振翅的飞机”——一种受生物启发但超越生物局限的全新智能范式。这不仅仅是一场技术冒险，更关乎一个根本性问题：我们能否打破当前AI的数据魔咒，开启一个更具创造力、更普惠的新智能时代？以下是本刊对三位创始人的独家专访，看这群“叛逆者”如何试图重新定义AI的进化法则。

　　最近几个月，冒出了一堆令人兴奋的研究型AI实验室，而“振翅飞机”是其中最有趣的一个。在年轻而充满好奇心的创始人们推动下，“振翅飞机”专注于寻找数据需求更少的AI训练方法。这对于AI模型的经济性和能力而言，可能是一个改变游戏规则的存在——凭借1.8亿美元的种子资金，他们有充足的跑道去实现它。

　　上周，我与该实验室的三位联合创始人——本·斯佩克特、阿舍·斯佩克特兄弟俩，以及艾丹·史密斯——聊了聊，为什么现在是创办新AI实验室的激动人心的时刻，以及他们为何总是回归到关于人类大脑的想法。

　　我想先问，为什么是现在？像OpenAI和DeepMind这样的实验室已经在模型扩展上花费了巨资。竞争无疑令人生畏。为什么你们觉得现在是创办一家基础模型公司的好时机？

　　本：因为有太多事情可做了。过去五到十年我们取得的进步是惊人的。我们热爱这些工具，每天都在使用。但问题是，这就是需要发生的全部吗？我们非常仔细地思考过，答案是否定的，还有很多事情要做。就我们而言，我们认为数据效率问题确实是需要关注的关键。当前的前沿模型是在人类知识总和上训练的，而人类显然可以用少得多的知识应付。所以这里存在巨大差距，值得我们去理解。?

　　我们所做的，实际上是对三件事的集中押注。一是押注数据效率问题是当前重要的方向。这个方向是全新的、不同的，并且可以取得进展。二是押注这具有巨大的商业价值，如果我们能做到，会让世界变得更美好。三是押注我们这样的团队——一个富有创造力、甚至在某种程度上缺乏经验、能够从头开始重新审视这些问题的团队——正是做这件事的合适团队。

　　艾丹：是的，完全正确。我们并不真的把自己看作是在与其他实验室竞争，因为我们认为我们关注的是截然不同的问题集。如果你观察人类思维，它的学习方式与Transformer模型有着天壤之别。这并不是说谁更好，只是非常不同。所以我们看到了这些不同的权衡。大语言模型具有惊人的记忆能力，并能利用极其广博的知识，但它们无法快速掌握新技能。适应新事物需要海量数据。而当你审视大脑内部时，你会发现它使用的算法与梯度下降以及当今人们训练AI的一些技术有着根本性的不同。这就是为什么我们要组建一支新的研究团队来解决这些问题，并真正以不同的方式思考AI领域。

　　阿舍：这个问题在科学上就非常有趣：为什么我们构建的智能系统与人类的做法如此不同？这种差异从何而来？我们如何利用对这种差异的认识来构建更好的系统？但同时，我也认为这实际上具有很高的商业可行性，并且对世界非常有益。许多真正重要的领域也受到数据的严重限制，比如机器人技术或科学发现。即使在企业应用中，一个数据效率提高一百万倍的模型，投入经济使用的难度可能也会降低一百万倍。因此，对我们来说，以全新的视角看待这些方法，并思考如果我们真的拥有一个数据效率高得多的模型，我们能用它做什么，这是非常令人兴奋的。

　　这引出了我的下一个问题，这也与“振翅飞机”这个名字有关。AI领域存在一个哲学问题：我们究竟在多大程度上试图重现人脑的运作，还是在创造一条完全不同的、更抽象的智能路径？艾丹来自Neuralink，那完全是关于人脑的。你们是否认为自己正在追求一种更神经形态的AI观？?

　　艾丹：我看待大脑的方式是将其视为一个“存在性证明”。我们将其视为证据，证明世界上还存在其他算法。正统不止一种。而且大脑有一些疯狂的约束。当你观察底层的硬件时，会发现一些疯狂的东西。激发一个动作电位需要一毫秒。在那段时间里，你的计算机可以进行非常非常多的操作。所以现实地说，很可能存在一种实际上比大脑好得多、也与Transformer非常不同的方法。因此，我们受到大脑某些功能的启发，但我们并不认为自己会被它束缚。

　　本：补充一点。这很大程度上体现在我们的名字里：振翅飞机。?把当前的系统想象成大型的波音787客机。我们不是要造鸟。那步子迈得太大了。我们试图建造某种“振翅的飞机”。我从计算机系统的角度来看，大脑和硅基芯片的约束条件彼此截然不同，因此我们不应期望这些系统最终看起来一样。当底层基质如此不同，并且在计算成本、数据局部性和移动数据的成本方面确实存在非常不同的权衡时，你实际上会预期这些系统看起来会有些不同。但仅仅因为它们看起来会有些不同，并不意味着我们不应该从大脑中汲取灵感，并尝试利用我们认为有趣的部分来改进我们自己的系统。?

　　现在实验室似乎有更多自由专注于研究，而不是仅仅开发产品。这对这一代实验室来说似乎是一个很大的不同。有些实验室非常专注于研究，而另一些则“目前专注于研究”。“振翅飞机”内部是如何看待这个问题的？

　　阿舍：我希望我能给你一个时间表。我希望我能说，三年后，我们将解决研究问题。这就是我们商业化的方式。但我不能。我们不知道答案。我们在寻找真理。话虽如此，我确实认为我们有商业背景。我曾花了很多时间为公司开发技术，为那些公司赚了不少钱。本孵化过许多有商业背景的初创公司，我们实际上对商业化感到兴奋。我们认为，将你创造的价值交到能够使用它的人手中，这对世界是有益的。所以我不认为我们反对商业化。我们只是需要从研究开始，因为如果我们一开始就签下大企业合同，我们会分心，也就无法进行有价值的研究。

　　艾丹：是的，我们想尝试真正、真正激进不同的东西，有时激进的东西甚至可能比现有范式更差。我们正在探索一系列不同的权衡。我们希望从长远来看，它们会有所不同。?

　　本：当公司真正专注于做好一件事时，它们才能发挥最佳状态，对吧？大公司有能力同时做很多很多不同的事情。当你是一家初创公司时，你真的必须选择你能做的最有价值的事情，并坚持做下去。就目前而言，当我们全力以赴解决基础问题时，我们正在创造最大的价值。?

　　实际上，我乐观地认为，在不久的将来，我们可能会取得足够的进展，然后可以开始接触现实世界。通过从现实世界获得反馈，你能学到很多。这个世界的美妙之处在于，它不断地教你东西，对吧？这是一个巨大的真理容器，你可以随时去观察。我认为，最近这些机构的经济和融资环境变化所带来的主要好处，是让公司能够真正在更长的时间内专注于它们擅长的事情。我认为这种专注，是我最兴奋的地方，它将让我们做出真正有差异化的工作。?

　　阐明一下我认为你指的是什么：投资者对此充满热情，机会如此明显，以至于他们愿意向一家全新的公司提供1.8亿美元的种子资金，这家公司充满了这些非常聪明但也非常年轻的人，他们并非来自PayPal之类的套现者。参与这个过程感觉如何？你们事先知道有这种需求吗？还是你们发现，实际上我们可以把这件事做得比想象中更大？

　　本：我想说是两者的结合。市场到现在已经火热了好几个月。所以大额融资轮次开始出现并不是秘密。但你永远无法完全知道融资环境会对你关于世界的特定想法作何反应。这又是一个你必须让世界对你的所作所为给予反馈的地方。即使在我们融资的过程中，我们也学到了很多，并且实际上改变了我们的想法。我们完善了关于应该优先考虑什么以及商业化正确时间表的看法。

　　我想我们有点惊讶于我们的理念引起了如此强烈的共鸣，因为这对我们来说是非常清晰的事情，但你永远不知道你的想法是否也会成为别人相信的东西，或者其他人是否认为你疯了。我们非常幸运地找到了一群出色的投资者，他们与我们的理念产生了真正的共鸣，他们说：“是的，这正是我们一直在寻找的。”这太棒了。你知道，既令人惊讶又美妙。

　　艾丹：是的，对研究时代的渴望已经弥漫在空气中一段时间了。越来越多地，我们发现自己被定位为追求研究时代、真正尝试这些激进想法的参与者。

　　至少对于规模驱动的公司来说，基础模型的入门成本极高。仅仅构建一个那种规模的模型就是一项计算密集得令人难以置信的事情。研究则处于中间位置，假设你们也在构建基础模型，但如果你们用更少的数据来做，并且不那么以规模为导向，也许你们能稍微轻松一点。你们预计计算成本会在多大程度上限制你们的跑道？

　　本：进行深入的基础研究有一个优势，有点矛盾的是，尝试真正疯狂、激进的想法比做渐进式工作要便宜得多。因为当你做渐进式工作时，为了弄清楚它是否有效，你必须沿着扩展阶梯向上爬很远。许多在小规模下看起来不错的干预措施，实际上在大规模下无法持续。因此，做那种工作非常昂贵。而如果你对某个新架构或优化器有一些疯狂的新想法，它很可能在第一次尝试时就失败，对吧？所以你不需要沿着阶梯向上运行它。它已经失败了。这很好。?

　　所以，这并不意味着规模对我们无关紧要。规模实际上是工具箱中所有可用工具中的一个重要工具。能够扩展我们的想法当然与我们公司相关。所以我不认为我们是规模的对立面，但我认为这是我们正在做的工作的一个美妙之处，我们可以在甚至不需要考虑大规模实施之前，在非常小的规模上尝试我们的许多想法。

　　阿舍：是的，你应该能够使用整个互联网。但你不应该*需要*使用整个互联网。我们觉得非常非常困惑的是，你需要使用整个互联网才能获得这种人类水平的智能。

　　那么，如果你们能够在数据上更高效地训练，会带来什么可能性？模型可能会更强大、更智能。但你们对发展方向有具体的想法吗？我们是在期待更好的分布外泛化能力，还是在期待模型用更少的经验就能在特定任务上表现得更好？

　　阿舍：首先，我们是在做科学，所以我不知道答案，但我可以给你三个假设。我的第一个假设是，在仅仅寻找统计模式和真正具有深刻理解的东西之间，存在一个广泛的谱系。我认为当前的模型位于这个谱系的某个位置。我不认为它们完全偏向深刻理解，但它们显然也不仅仅是在做统计模式匹配。有可能当你用更少的数据训练模型时，你实际上迫使模型对其所见的一切都有极其深刻的理解。当你这样做时，模型可能会以非常有趣的方式变得更智能。它可能知道的事实更少，但推理能力更强。这是一个潜在的假设。?

　　另一个假设与你所说的类似，即目前，无论是操作上还是纯粹的货币成本上，教模型新能力都非常昂贵，因为你需要大量数据来教它们这些东西。我们工作的一个可能产出是，在后训练阶段变得高效得多，以至于只用几个例子，你就能真正让模型进入一个新领域。?

　　还有一种可能是，这直接为AI解锁了新的垂直领域。例如，在某些类型的机器人技术中，无论出于何种原因，我们无法获得真正使其具有商业可行性的那种能力。我的观点是，这是一个有限数据问题，而不是硬件问题。你可以通过遥操作让机器人做事情，这一事实证明了硬件已经足够好。但像这样的领域还有很多，比如科学发现。?

　　本：我还要强调一点是，当我们思考AI对世界可能产生的影响时，你可能会持有一种观点，即这是一种通缩技术。也就是说，AI的作用是自动化一堆工作，接手这些工作并使其成本更低，从而将工作从经济中移除，由机器人来完成。我确信这会发生。但在我看来，这不是AI最激动人心的愿景。最激动人心的AI愿景是，我们可以构建各种新的科学和技术，这些是人类不够聪明而无法想出来的，但其他系统可以。?

　　在这方面，我认为阿舍刚才谈到的第一个轴——介于真正的泛化与数据记忆或插值之间的谱系——对于产生深刻的洞察力、从而带来医学和科学的新进展至关重要。模型必须非常偏向这个谱系的创造力一侧，这很重要。因此，我对我们正在做的工作感到非常兴奋的部分原因是，我认为即使超越个体经济影响，我也确实非常以使命为导向，围绕着这个问题：我们能否真正让AI做出一些以前人类根本做不到的事情？这不仅仅是“让我们解雇一大批人”那么简单。

　　当然。这是否让你们在关于AGI的讨论、关于分布外泛化的讨论中，站在了某个特定的阵营？

　　阿舍：我真的不太确切知道AGI是什么意思。很明显，能力正在飞速进步。很明显，正在创造巨大的经济价值。但在我看来，我认为我们离“盒子里的上帝”还很远。我不认为在两个月甚至两年内，会出现一个奇点，让人类突然完全过时。我基本上同意本一开始说的，这是一个非常大的世界。有很多工作要做。有很多了不起的工作正在进行，我们很兴奋能做出贡献。

　　那么，关于大脑和神经形态部分的想法确实感觉是相关的。你们是说，与大语言模型真正相关的比较对象是人脑，而不是之前的机械计算机或确定性计算机。

　　艾丹：我要强调，大脑不是天花板，对吧？大脑在很多方面是地板。坦率地说，我没有看到任何证据表明大脑不是一个遵循物理定律的可知系统。事实上，我们知道它受到许多约束。因此，我们期望能够创造出从长远来看比大脑更有趣、更不同、可能也更好的能力。所以我们很兴奋能为那个未来做出贡献，无论那是AGI还是别的什么。

　　阿舍：我确实认为大脑是相关的比较对象，只是因为大脑帮助我们理解这个空间有多大。比如，很容易看到我们已经取得的所有进展，然后想，哇，我们好像有了答案，我们快完成了。但如果你向外看一点，尝试拥有更广阔的视角，就会发现还有很多我们不知道的东西。?

　　本：我们本质上不是要变得更好。我们是要变得不同，对吧？这是我这里真正想强调的关键。所有这些系统几乎肯定会有不同的权衡。你会在某个地方获得优势，并在其他地方付出代价。外面的世界很大。有这么多不同的领域，有这么多不同的权衡，拥有更多的系统和更基础的技术来应对这些不同的领域，很可能会让AI更有效、更迅速地扩散到全世界。

　　你们区分自己的一种方式，是你们的招聘方法，招揽非常非常年轻的人，有些甚至还在上大学或高中。当你们与某人交谈时，是什么触动了你们，让你们觉得，我希望这个人跟我们一起研究这些问题？

　　艾丹：就是当你和某人交谈时，他们让你眼花缭乱，他们有很多新想法，他们思考问题的方式是许多成熟的研究人员无法做到的，因为他们没有被成千上万篇论文的背景所“污染”。真的，我们寻找的首要特质是创造力。我们的团队非常有创造力，每天我都感到非常幸运，能够进去和人们讨论AI中一些大问题的真正激进的解决方案，并构想一个非常不同的未来。

　　本：? 我个人寻找的首要信号可能就是，我和他们在一起时，他们是否教会我新东西？如果他们教会我新东西，那么他们很可能也会在我们正在研究的工作上教会我们新东西。当你做研究时，那些创造性的新想法才是真正的优先事项。?

　　我背景的一部分是，在我本科和博士期间，我帮助创办了一个名为Prod的孵化器，与许多后来发展不错的公司合作过。我认为我们从中学到的一点是，年轻人绝对可以在行业的最高层竞争。坦率地说，解锁的关键之一就是意识到，是的，我可以去做这些事情。你绝对可以在最高水平上做出贡献。?

　　当然，我们也认识到经验的价值。那些在大型系统上工作过的人很棒，比如，我们雇佣了一些这样的人，你知道，我们很高兴与各种各样的人合作。我认为我们的使命也引起了经验丰富人士的共鸣。我只是认为，我们的关键点是，我们需要那些不害怕改变范式、能够尝试想象事物如何运作的新系统的人。

　　我一直困惑的一件事是，你们认为最终产生的AI系统会有多大不同？我可以很容易地想象出像Claude Opus那样的东西，只是性能好20%，能做多20%的事情。但如果它是全新的，就很难想象它会走向何方，或者最终结果会是什么样子。

　　阿舍：我不知道你是否曾有幸与GPT-4基础模型对话过，但它有很多非常奇怪的新兴能力。例如，你可以拿一段你自己未写的博客文章片段，问它你认为这是谁写的，它能够识别出来。

　　有很多类似这样的能力，模型以我们无法理解的方式表现出智能。未来的模型将以更奇怪的方式变得更智能。我认为我们应该预期未来会非常奇怪，架构会更加奇怪。我们寻求的是数据效率上1000倍的胜利。我们不是在做渐进式改变。因此，我们应该预期在极限状态下，会出现同样不可知的、异质的改变和能力。

　　本：我大体上同意这一点。我可能对于这些事物最终如何被世界体验的看法稍微温和一些，就像GPT-4基础模型被OpenAI“驯化”一样。你希望以某种形式呈现事物，让消费者不必凝视深渊。我认为这很重要。但我大体上同意，我们的研究议程是关于构建与当前所能做到的有着根本性不同的能力。

　　太棒了！人们有什么方式可以与“振翅飞机”互动吗？现在还为时过早吗？还是他们应该静候研究和模型出炉？

　　阿舍：我们有Hi@flappingairplanes.com。如果你只是想打个招呼。我们还有disagree@flappingairplanes.com，如果你想反对我们。实际上，我们已经有过一些非常酷的对话，有人给我们发来很长的文章，阐述为什么他们认为我们正在做的事情是不可能的。我们很乐意与之交流。?

　　本：但他们还没有说服我们。目前还没有人说服我们。

　　阿舍：第二件事是，你知道，我们正在寻找试图改变这个领域、改变世界的杰出人才。所以如果你有兴趣，应该联系我们。

　　本：如果你有非传统的背景，也没关系。你不需要两个博士学位。我们真正寻找的是那些以不同方式思考的人。

“振翅”飞机公司谈AI未来：“我们要尝试真正颠覆性的创新”

相关推荐