近日,知名VC A16Z的合伙人Anjney Midha与英伟达创始人兼CEO黄仁勋、Mistral联合创始人兼CEO Arthur Mensch在其播客节目中讨论了主权人工智能、国家人工智能战略,以及为什么每个国家都必须掌控自己的数字智能等话题,其中着重讨论了当AI日渐成为新一代国家基础设施的之际,国家如何部署AI、应对AI竞争。
Mistral是一家法国的AI公司,创立于2023年,专注于开发开源大模型,Arthur Mensch此前曾就职于DeepMind。A16Z和英伟达均是Mistral的投资方,Mistral上一轮融资后估值约为62亿美元。
在访谈中,两位创始人也探讨了关于开源和闭源模型与安全之间的关系,二人均认为,国家限制输出模型,并不能意味着就会变得更"安全",反而开源模型的飞轮效应能够加速AI进程,从而使"闭关锁国"背景下的模型面临很高的被淘汰风险。
此外,二人还对AI通用性与专用性之间关系进行了讨论,他们均认同AI是一种通用技术,但同时也是一种专用型技术,在国家层面,需要更好地适应国情、文化和社会习惯等因素,因此,对于国家而言,"亲自下场"参与尤为重要,不能指望外包"作为基础设施的数字智能"。
以下为"明亮公司"结合AI编译的对话内容:
AI将是国家的基础设施
Anjney Midha:今天,我们来聊"主权AI",让我们先从不同国家的领导者那里得到的第一个问题开始——AI实际上是一种通用技术吗?在人类历史上,我们可能只有少数这样的技术。一些经济学家称,这些技术加速了整个社会的经济进步,例如电力、印刷机等等。现在每个人都在问的问题是,这是思考AI的正确方式吗,还是AI只是另一种重要但最终只是垂直领域的技术?
Arthur Mensch:它是一种通用技术,因为它从根本上改变了我们构建软件和运用机器的方式。就像互联网是一种通用技术一样,AI也是一种通用技术。它允许构建代表你行事的Agent,在这方面,它可以用于任何行业的垂直领域。它可以用于服务、公共服务,它可以改变民众的生活,它可以用于农业,当然也可以用于国防目的,所以它涵盖了国家需要关注的一切。因此,从这个角度来看,任何国家将其作为优先事项并制定专门的国家AI战略是非常自然的。
黄仁勋:100%同意Arthur所说的。而且,这也是人们放弃的原因:如果它是一种通用技术,且一家公司可以构建最终的通用技术,那么为什么其他人不能做同样的事情呢?但这也是一个思维把戏,让人们相信这种技术只能由少数人去构建,而其他人只需坐享其成。
我建议每个人都参与AI,这不是特权阶层的专属。智能技术是为每个人服务的,不仅仅是世界上少数几家公司应该去构建它。没有人会比瑞典更关心瑞典文化、瑞典语言、瑞典人民和瑞典生态系统。没有人会比沙特更关心沙特的生态系统。没有人会比以色列更关心以色列……
技术是通用的,但智能技术也是高度专业化的,原因是这样的:坦白说,我不认为我会等待一个通用聊天机器人成为某个特定疾病领域的专家。我仍然认为,我宁愿有一个在该领域高度专业化的人员,去微调、训练,使其专门化。
Arthur Mensch:AI是一种通用技术,就像编程语言一样。它还是一种承载了文化的技术,这意味着,存在一种基础设施,当然,不是每个国家都会打造芯片。像基础模型、Web压缩这样的通用模型,最终会开源,可以作为构建专门系统的正确基础。
但除此之外,我认为这取决于组织、企业、国家去构建他们的所需。让其发挥作用的方法是,采用像开源模型这样的通用模型,并将你所拥有的特定知识,或者让你的公民、让你的员工将他们的知识提炼到系统中,提炼到代表你行事的Agent中,从而使这Agent逐渐变得更准确,更符合国家或企业构建AI系统时的指令和规范。
因此,你需要垂直领域的专家,你需要文化专家,你需要那些拥有特定国家议程的人,与技术公司合作,这些公司能够以易于使用的方式,以易于专门化的方式,展示开源基础设施。我认为,这就是前沿,它是一种非常水平化(horizontal)技术,但要使其发挥任何作用,你需要水平提供者与垂直领域专家之间的合作。
与历史上的其他通用技术浪潮不同,比如电力或印刷机,这一次有什么不同呢?如果我是国家领导人,我应该如何思考我们国家的AI?我应该将其视为数字劳动力吗,还是将其视为某种桥梁?
我认为,它与电力相似。从经济角度来看,它将在未来几年内对每个国家的GDP产生两位数的影响。这意味着每个国家都需要关注它,因为如果他们不能在合适的地方建立基础设施,建立属于自身主权的能力,那么这意味着可能会有资金流向其他国家。因此,这在一定程度上改变了全球的经济平衡。
从这个意义上说,它与一百年前的电力并没有太大不同。当时,建设电力工厂,你是在为从邻居那里购买做准备。当然,最终这很好,因为它创造了一些依赖关系。所以,我认为从这个意义上说,它是相似的。
有什么不同呢?我认为有两点。首先,它是一种有点模糊的技术。如果你想要用它来创造数字劳动力,你需要塑造它,你需要有基础设施、人才和软件,而人才需要在本地培养。我认为这很重要,原因在于,AI与电力不同,这是一种内容生成技术。因此,你有产生内容的Agent,它们生产文本、生产图像、生产语音,与人互动……而当你生产内容并与社会互动时,你就成为一种社会构建。
这一意义上,社会构建承载着文化,承载着企业或国家的价值观。因此,如果你不希望这些价值观消失,也不希望依赖于集中的供应商,你需要更深入地参与其中,而不是像对待电力那样去参与。
Anjney Midha:你同意这个观点吗,Jensen?
黄仁勋:有几种方法可以思考这个问题。一个方向是,国家的数字智能不太可能是想要外包给第三方的东西。
一些需要考虑的因素是,你的数字智能现在是你的一种新基础设施,就像你的电信、医疗保健、教育、高速公路、电力一样,而现在来到了新的一层,就是你的数字智能。你有责任决定这种数字智能如何发展,以及你是否希望将其外包,或者这是你想要参与的,甚至可能控制并塑造成为国家基础设施的东西。
另一种思考方式是你的数字劳动力。现在这是新的一层,你必须决定这个国家或公司的数字劳动力,是你决定外包,希望它按照你所期望的方式发展,还是你想要参与,甚至决定控制、培养并使其变得更好。
我们总是雇佣通用型员工,我们从学校招聘他们,他们中有些人比其他人更通用,有些人比其他人更聪明。一旦他们成为我们的员工,我们决定让他们入职。培训他们,给他们设置护栏(guardrailing),评估他们,持续提升他们。我们投入必要的资源,将通用智能转化为超级智能,从而让我们受益。
在这两种情况下,它都为国家经济做出贡献,它都为社会进步做出贡献,在两种情况下,它都为文化做出贡献。我认为在这两种情况下,国家都需要在其中发挥非常积极的作用。没错,它确实是一种通用技术,但你必须决定如何塑造它。
你们国家的数据是属于你们的、你们的国家图书馆,你们的历史,你们想要将其数字化,你们可以将其提供给全世界,你也可以提供给国内的公司、研究人员和机构,它属于你们。当然,这些都是非常模糊的东西,它们是非常软性的概念。但它确实属于你们,你可以决定如何将其用于造福你的人民,它属于你们,因为你有责任塑造它的未来主权,这是你们的责任。
Anjney Midha:除了军事、电力网络等国家资助和保护的资产外,如果没有理解AI基础设施和主权AI的关键性,是否需要控制整个技术栈?
Arthur Mensch :Jensen提到数字劳动力,我认为这是一个很好的类比,你需要为你的 "AI劳动力"提供就业的平台,这意味着你需要能够定制模型,并将你国家图书馆中的知识注入到模型中,这样它突然就能更好地使用你的语言。你需要能够让你的系统了解你的法律,以便当你部署AI软件时,符合你所设置的边界。
那个就业平台需要能够定制、设置护栏(guardrailing)、评测,然后当注意到某些事情需要改进时,修复问题,调试问题。这就是我们正在构建的平台。一旦定制系统完成,能自己维护它们是很重要的。这意味着能够在你自己的基础设施上部署它们,能够让你的技术合作伙伴潜在地消失。
黄仁勋:你的IT部门将成为你的数字劳动力的HR部门,他们将使用Arthur描述的这些工具来入职AI、微调AI、设置护栏、持续评估它们并改进它们。那个飞轮将由现代版本的IT部门管理,我们将拥有生物劳动力和数字劳动力,这是非常棒的。所以没有人会为你做这件事,你必须自己去做。
尽管我们有这么多技术公司,每个公司仍然有自己的IT部门,我有自己的IT部门,我不会在未来将其外包给其他人。它们对我来说将变得更加重要,因为它们将帮助我们管理这些数字劳动力。你将在每个国家、每个公司中都这样做,而这些国家中的每个公司都将这样做。所以对于Arthur所描述的,要将这种通用技术微调后真正成为相关领域专家,这是AI的巨大未来空间。
Anjney Midha:我想确认下你们两人所说的,你提到文化,你说有一系列规范,你定制模型时训练数据中就有这些规范(norms)。
黄仁勋:你说的是规范,这正是意味着它是软性的,而不是规则,规则更硬,算法也是,算法和法律是非常具体的。
Arthur Mensch:是的,你想在系统中融入不同的东西。有一些风格和知识的元素,你不会通过严格的边界设置来强制执行,而是可以通过持续训练模型来实现。你采用国家图书馆的内容、采用偏好,并将其提炼到模型中。然后你有一套流程,如果你在公司里,你有一套政策,这些是严格的,所以通常构建的方式是,你将模型连接到严格的规则上,并确保每次输入时,都验证规则是否得到遵守。所以,一方面是软性的,偏好、文化。
黄仁勋:人的偏好是多维的,有太多特征定义了我的偏好,很难想象如果让人类用Python来描述这些,比如用C++来描述"基于这个,我更喜欢这个,但如果那样做,我更喜欢另一个东西"。如果人类真的那样做,规则的数量将是难以想象的,这就是为什么AI有能力将所有这些代码化。它是一种能够处理生活模糊性(ambiguity of life)的新编程模型。
Anjney Midha:你的意思是AI不仅仅是一种计算基础设施,它也是一种文化基础设施。
Arthur Mensch:它关乎确保你的文化基础设施以及公司或国家中的人类专业知识能够融入到AI系统中。
黄仁勋:文化会刷新价值观。我们刚才还在讨论,这些AI模型、AI服务对提问的回应方式各不相同,对吧?因为它们已经将服务或公司的价值观编程到各自的服务中了。你能想象它在国际层面上的规模效应吗?
Arthur Mensch:这是集中式AI模型的一个内在局限性,你认为你可以将一些普遍价值观和普遍专业知识写入一个通用模型中。在某个时候,你需要将通用模型拿过来,问特定的员工群体或大众群体,他们的偏好是什么,他们的期望是什么,你需要确保你以一种软性方式和硬性方式来专门化这个模型,通过规则和文化偏好。所以这部分是不能外包的,无论是作为一个国家还是作为一个企业,你需要掌控它。
Anjney Midha:可能这么说有点夸张——如果它是一种文化基础设施,而我没有它的主权,那么所涉及的利害关系基本上相当于"现代数字殖民"。如果你说,你得把AI当作几乎是你的数字劳动力,而另一个国家或不是我的主权国家的人可以决定我的数字劳动力能做什么或不能做什么,那这就是一个问题。
黄仁勋:有些东西是普遍的,例如,某些公司可以为全世界的国家和社会以及公司服务,因为它是基本通用的,但它不能是唯一的社会肌理,它不能是唯一的层级,它不能是唯一的数字智能层,它必须由某种地区性的内容来增强。
嘿,你知道,我认为麦当劳到处都很好,肯德基也到处都很好,星巴克也不错。但你仍然希望有当地的风格、当地的口味来增强它。这就是文化,它定义了社会、定义了我们。所以我认为到处都有沃尔玛是可以的,你可以依赖它。但你需要有当地的风格、当地的口味、当地的服务。
也许让我换一种说法,很可能在未来,就我们的数字劳动力而言,我们会有一些通用的数字工人,它们擅长做一些基础研究或类似的事情,对每家公司来说都不必要重新创造,对吧?我认为Excel很好,Microsoft Office是普遍优秀的,我很乐意使用它。
Anjney Midha:一个好用的参考架构。
黄仁勋:没错,然后还有行业特定的工具和行业特定的专业知识,这对我们来说很重要。……你的数字劳动力也会是这样的,AI也会是这样的。会有一些你可以直接从货架上拿下来的东西,新的搜索很可能会有一些AI,但然后会有工业版本的AI,我们可能会从Cadence和其他公司那里得到,然后我们不得不培养我们自己的,使用Arthur的工具,我们不得不微调它们,让他们变得更好。
Arthur Mensch:我非常同意这种愿景,即有一个通用模型,然后有一些行业层面的专门化,然后是公司和国家层面的更高一层专门化。你会有一个越来越专门化的AI系统树。
也许可以举一个具体的例子,就是我们最近在1月份发布的Mistral模型,它是一个通用模型,所以它会说所有的语言,它对大多数事情都有所了解。但随后,我们开始了一个新的专门化模型家族,这些模型在语言方面进行了专门化。所以我们加入了更多的阿拉伯语,更多的印度语言,并重新训练了模型,我们将这些额外的知识提炼出来,这些知识是初始模型未曾见过的。通过这样做,我们实际上让它在说阿拉伯语和印度半岛的语言时更加符合习惯用法。
而且,对于给定大小的模型,如果你选择专门化它,你可以得到一个更好的模型。今天,我们的24B模型,经过阿拉伯语专门化后,表现超过了其他五倍大的语言模型,原因就在于我们进行了专门化。
这是第一层。然后,如果你考虑下一个更高层次,你可以考虑垂直领域。所以,如果你想构建一个模型,它不仅擅长阿拉伯语,而且还能处理沙特阿拉伯的法律案件,例如。好吧,你需要再次专门化,所以还有一些额外的工作需要与公司合作完成,以确保你的系统不仅擅长说某种语言,而且还能理解在这种语言中进行的法律工作,所以对于任何语言和垂直领域的组合,你都可以想象到,都需要进行专门化。
如果你想要一个会说法语的医疗诊断助手,好吧,你需要擅长法语,但你也需要理解如何用法语进行医疗诊断,对吧?所以这两件事对于通用模型提供商来说是非常难做的。
Anjney Midha:如果你所描述的是对的,那么我需要在我们的本地规范、我的本地数据上定制这个AI层,这从技术能力角度来看相当复杂。那么,你会如何建议一个大国去思考这个技术栈呢?我们谈论的是芯片、计算、数据中心、模型、应用,然后最终是你描述的AI护士或AI医生。你会如何建议一个较小的国家与之不同地去思考呢?
Arthur Mensch:我会建议拥有这个技术栈的水平化(horizontal)部分,所以你需要基础设施,你需要推理基元(inference primitives),你需要定制基元,你需要可识别性,你需要能够将边界连接到模型上,将模型连接到实时信息源等,这些基元在不同国家、不同企业都是工业化的,都能买得到。然后你可以根据你的价值观、你的专业知识、你的本地人才,从这些基元开始构建。
问题是,什么是水平化的?可以如果你是一个小企业或小国家,你应该购买什么,而什么又是仅适用于你的、需要你自己去构建的。
黄仁勋:你必须明白,这并不像你想象的那么难。首先,因为技术正在变得更好,更易于使用。你能想象五年前做这件事吗?那是不可能的。你能想象五年后做这件事吗?它将变得微不足道。我们正处于中间阶段。唯一的问题是,你是否需要去做这件事?如果你得出结论,这对你是重要的,那么你就必须尽快参与其中,学习并一路学习,只要知道它正变得越来越容易。
事实上,我们尝试去做Agent系统,三年前也是极其困难的,但Agent系统如今要容易得多。所有用于策划数据集、入职数字员工、评估员工、设置护栏的工具,所有这些都在不断改进。关于技术的另一点是,当它变得更快时,它就变得更容易了。
你知道,我有幸见证了计算机从最早的时期开始发展。计算机的性能曾经是如此令人沮丧地慢,你所做的一切都很困难。但如今,你知道,我们所做的事情是如此神奇,因为速度也很快。无论是出于你的机构需求,还是出于参与这项有史以来最重要的技术,事实是,它正在变得越来越好,所以借口越来越少。
Anjney Midha:因为变革是困难的。如果我是国家领导人,我面临着不断增加的地缘政治风险,我不知道我的盟友是谁,选举即将到来,我有无数的事情需要处理。但现在,假设我理解了这一点,你花了很多时间与国家领导人交谈,他们询问关于快速部署AI的风险,你从他们那里听到的最常见的问题是什么?
Arthur Mensch:我听到过一些问题,但其中一个风险是看到你的民众开始害怕这项技术,担心它会取代他们。然而,如果我们可以共同努力,确保每个人都能接触到这项技术并接受使用它的培训,那么这种恐惧是可以避免的。因此,对民众的技能培养是极其重要的,要让人们明白AI是一个机会,让他们能够更好地工作,并通过应用程序、通过他们可以在智能手机上安装的东西、通过公共服务来展示其真正的目的。
例如,我们正在与法国的失业系统合作,通过AI Agent将就业机会与失业者联系起来,这些Agent当然由机构内的人类操作员激活,这是一个非常容易被接受的机会,让人们更好地找到工作。因此,这是确保民众理解机会的一部分,AI真的只是他们需要采用的一种新变化,就像他们在90年代采用个人电脑,以及在2000年代采用互联网一样。
这些变化的共同点是,你需要让人们接受这项技术。我认为国家可能面临的最大问题是,AI可能会增加已经相对较大的数字鸿沟。但如果我们共同努力,并以正确的方式去做,我们可以确保AI实际上正在缩小数字鸿沟。
黄仁勋:AI是一种新的编程计算机的方式,因为它通过输入一些文字,你可以让计算机做某事。就像我们过去所做的那样,我们输入文字,让计算机做某事。现在你可以与它对话,你可以通过多种方式与它互动,你可以让计算机为你做事,这比以前容易得多。今天能够使用ChatGPT编程计算机的人数远远超过能够使用C++编程计算机的人数。因此,从人类潜力的角度来看,我们已经缩小了技术差距,这可能是迄今为止我们所见过最伟大的技术平权因素。
Arthur Mensch:但你仍然需要让民众了解它。
黄仁勋:我只是在描述一个事实。事实是,使用ChatGPT编程计算机的人数比使用C++编程计算机的人数要多。实际上,在过去的三年里,这是一个不争的事实。
……
开源:更加安全还是更高风险?
Anjney Midha:让我们来谈谈开源的热潮,因为你们两人都公开谈论过在主权背景下开源模型的重要性。去年,Nvidia和Mistral共同训练了一个名为Mistral NeMo的模型。为什么开源模型是你们如此重要的一部分?为什么开源模型是你们如此重要的一部分?
Arthur Mensch:首先,这是一种水平化的(horizontal)技术,企业和国家最终愿意在自己的基础设施上部署它。从主权的角度来看,拥有这种开放性是很重要的。第二点是,发布开源模型很重要,因为它可以加速进程。我们创建Mistral的基础是,我们在2010年至2020年之间进行AI研究时看到,由于每个实验室都在相互构建,进程加速了,而这种加速在第一个大型语言模型出现后,尤其是OpenAI的模型之后,就消失了。
因此,重新启动这种开放的飞轮——我贡献一些东西,然后另一个实验室贡献其他东西,然后在此基础上进行迭代——这就是我们创建Mistral的原因,我认为我们在这方面做得很好,因为我们开始发布模型,然后Meta也开始发布模型,然后中国公司如DeepSeek发布了更强大的模型,每个人都能从中受益。
回到NeMo,关于创建AI模型的开放方式的一个困难是,这更像是一个大教堂而不是集市,当涉及到开源时,因为构建一个模型需要大量的投入。因此,我们与Nvidia团队所做的就是真正将两个团队结合起来,让他们在相同的基础设施上工作,使用相同的代码,解决相同的问题,并结合他们的专业知识来构建同一个模型。这非常成功,因为Nvidia带来了我们不知道的东西,而我们带来了Nvidia不知道的东西,最终我们生产出了当时同尺寸下最好的模型。
因此,我们真的相信这种合作,并且认为我们应该在更大规模上进行更多合作,不仅仅是两家公司,而是可能三家或四家公司,这就是开源将如何占上风。
黄仁勋:是的,我完全同意。开源的好处,除了加速并提升所有通用模型和通用能力的基础科学外,开源版本还激活了大量的利基市场和利基创新。突然之间,在医疗保健、生命科学、物理科学、机器人技术、交通等领域,由于开源能力足够好而被激活的行业数量是惊人的。
Anjney Midha:但在任务关键型领域,数据可能很敏感。
黄仁勋:是的,例如,在能源开采领域,谁会去创建一个AI公司来开采能源呢?能源开采本身是一个非常重要的领域,但能源开采的市场规模并不大,因此开源激活了每一个这样的领域,金融服务也是如此,你可以随意挑选。
Arthur Mensch:任何"任务关键型"的领域,都需要做自有部署,可能还需要在边缘进行部署,对任何需要进行强审计并能够进行彻底评估的领域,如果你能够访问权重,你就可以更好地评估一个模型,而不是仅仅通过API访问。因此,如果你想要围绕你的系统建立100%的准确性,我认为你不应该使用闭源(模型)。
黄仁勋:而且你必须将其融入到你的循环中。如何将你的本地数据连接起来?将它与你自己的本地数据、你自己的本地经验连接起来。使用得越多,它就变得越好。那个飞轮,你无法在没有开源的情况下做到这一点。
Anjney Midha:假设我是一个国家领导人,我正在考虑开源,我开始听到有人说:"嘿,开源是对国家安全的威胁。我们不应该出口我们的模型,因为这些开源模型实际上泄露了太多信息。更重要的是,坏人也可以使用这些开源模型,因此这对安全构成威胁。相反,我们应该做的是关上大门,只允许两三个获得政府许可的拥有基础设施的实验室获来进行训练。"我确实听到很多这样的说法。我应该如何思考这个问题?这与你告诉我的相反,即开源对于任务关键型行业更好?
Arthur Mensch:实验室之间的合作对于人类的成功至关重要。如果一个国家决定封锁一切,唯一会发生的事情是另一个国家将占据领导地位。切断自己与"开源飞轮"的联系,对于保持竞争力的代价实在太高了。
在美国有这样的争论,如果一个国家对模型权重(weights)进行出口管制,这并不会阻止欧洲或亚洲的任何国家继续取得进展,他们甚至将合作以加速这一进程。因此,我认为我们需要接受这样一个事实——这是一种水平化(horizontal)技术,非常类似于编程语言,编程语言都是开源的,对吧?我认为AI也需要开源。
黄仁勋:控制软件是不可能的。如果你试图控制它,那么其他人会说:"好吧,让我们自己来。"就像Arthur提到的那样。问题是,开源更安全吗?开源提供了更多的透明度,更多的研究人员,更多人的检查。这就是为什么世界上每一个云服务提供商都是基于开源构建的。
给我一个例子,一个公共云今天是基于非开源的基础设施堆栈构建的。你从开源开始,你可以对其进行定制。但开源的好处是,有这么多人的贡献。而且,开源的检查是非常重要的。你不能在开源中随意放置任何东西。如果你这样做,你会在网上被人嘲笑。你必须在开源中放置好的东西,因为审查是如此严格。因此,我认为开源提供了所有这些好处:促进合作、加速创新、提升卓越、确保透明度、更多检查——所有这些都提高了安全性。
Anjney Midha:从某种意义上说,你们认为,部分原因是开源更安全,就像我们看到的开源数据库、存储和网络计算一样。全世界都可以帮助你进行红队测试(red teaming),而不是只有公司内部的一小群研究人员。
黄仁勋:是的,没错。
Arthur Mensch:通过将许多组织聚集在一起,共同开发一种技术,使他们都可以使用并针对自己的领域进行专门化,你实际上是在强迫技术对每个人都变得更好。因此,这意味着你正在消除偏见,你正在确保你构建的通用模型尽可能好,不会出现故障。我认为从这个意义上说,开源也是一种减少故障点的方法。
如果你今天是一家公司,决定完全依赖单一组织及其安全原则和红队测试组织,你可能有点过于信任它了。而如果你基于开源模型构建我的技术,你实际上是信任世界,确保你所构建的基础是可靠的。所以,这减少了故障点,这显然是一个企业和国家都需要做的事情。
打造公司:什么是好的组织结构?
Anjney Midha:我们现在要稍微转换一下话题,谈谈公司建设,这是很多人非常期待从你们两位那里听到的内容。那么,让我们先从你开始,Jensen。你提到Nvidia是世界上最小的大公司。是什么让你们能够以这种方式运作?
黄仁勋:我们的架构是为了适应快速变化的世界而设计的,这种变化可能是由我们自己引起的,也可能是影响我们的外部因素。原因在于,技术变化非常快。如果你过度强调可控性,那么你就会削弱系统适应变化的能力,无法保持敏捷。因此,我们的公司文化强调"对齐"(aligned),而不是"控制"(control)。我很少使用"控制"这个词来描述公司的运作方式。我们注重最小化官僚主义,让流程尽可能轻量化,以提高效率和敏捷性。
是在平静的乡村,还是更接近于水泥森林?你处于什么样的环境中?因为你要构建的系统类型应该与你所处的环境保持一致。让我感到奇怪的是,每家公司的组织架构看起来都很相似,但它们做的事情却各不相同。一家公司可能像蛇一样灵活,另一家可能像大象一样庞大,还有一家可能像猎豹一样敏捷。尽管它们在森林中都扮演着不同的角色,但它们的组织架构却惊人地相似,这似乎并不合理。
Arthur Mensch:我同意,公司确实有各自特点。尽管它们的组织架构有时看起来相似,但我们还有很多东西要学习。我们的公司还不到两年历史,所以对我们来说,最大的挑战之一是,Mistral是一家深科技公司,它是由科学驱动的。科学并没有软件行业那样的时间尺度,你不能按月来规划。有时候,你并不清楚事情什么时候会准备好,但与此同时,客户却在询问下一个模型何时推出,某种能力何时可用。
因此,我们需要管理好客户的期望,我认为这是我们正在做的一件好事。我们需要在产品需求和科学研究之间找到平衡。你不想让研究团队完全专注于让产品工作,你需要让他们保持一定的独立性。
我认为我们在这方面做得很好,我们开始在公司内部实现不同频率的运作——在项目方面,我们每周进行迭代;而在科学研究方面,我们则更注重深入探索,研究产品在某些领域为何表现不佳,以及如何通过研究、新数据、新架构或新方法来改进它。这种模式在典型的SaaS公司中是不存在的,因为这本质上是一个科学问题。
Anjney Midha:Nvidia是一家在过去30多年里非常成功的公司,它已经找到了让科学和研究始终领先于世界的一些方法,无论是2012年的CUDA,还是今天的Cosmos,后者在模拟领域无疑是最先进的。那么,这种模式是否正确呢?
黄仁勋:我们在公司内部协调了Arthur刚才所说的。我们有基础研究、应用研究,然后是架构设计,最后是产品开发。我们有多个层面,这些层面都是必不可少的。是的,它们都有自己的时间节奏。在基础研究方面,频率可能相当低,但另一方面,在产品方面,我们有一个庞大的行业客户群体,他们依赖我们。
因此,我们必须非常精确。一方面,我们管理基础研究,希望发现那些没有人预料到的惊喜;另一方面,我们又要能够满足大家的预期,可预测地交付产品。我们在公司内部协调了这两个极端。
Anjney Midha:这个市场中有许多令人困惑的事情,但其中有一件我想特别指出:客户同时也是你的竞争对手。Nvidia向AWS出售GPU,而AWS正在开发自己的芯片,名为Trainium。Arthur,你们训练的模型通过AWS和Azure销售,而这些云服务提供商资助了像Anthropic和OpenAI这样的实验室。在这种环境下,你们如何取得胜利?你们如何管理这些关系?因为我们之前谈到了公司内部的建设,但现在我很好奇,你们如何在这种外部环境中生存?
Arthur Mensch:Jensen说得很对,你要放弃控制,但要努力保持一致。尽管有时候某些公司可能是竞争对手,但你们可能有共同的利益,可以在特定的议程上合作。
黄仁勋:你必须有自己的位置。显然,这些云服务提供商与Arthur合作,并不是因为他们已经有了相同的东西,而是因为他们希望拥有两样类似的东西。这是因为Arthur和Mistral在世界上拥有独特的地位,它们在特定领域提供了独特的价值。我们今天讨论的许多内容都是Mistral和Nvidia在世界上独特擅长的领域。我们与众不同。
你知道,我们不仅仅是一个ASIC(专用集成电路)制造商。我们能够为云服务提供商(CSPs)做很多事情,这些是他们自己无法做到的。例如,我们的架构被广泛应用。在很多方面,我们是未来初创公司的第一个切入点,原因在于,通过与Nvidia合作,他们不需要在战略或商业上绑定任何主要的云服务商。他们可以对接每一家云服务提供商,甚至可以决定自己建立系统,因为最终,经济因素可能会对他们更有利,或者他们可能希望获得我们提供的一些在云服务提供商内部受到保护的能力。
无论出于何种原因,为了成为一个好的合作伙伴,你仍然需要有一个独特的地位,你需要有一个独特的价值主张。我认为Mistral有一个非常独特的价值主张,我们也有一个非常独特的价值主张。我们在世界上的位置很重要,即使是我们与之竞争的人。
当我们在舒适区内时,当我们对自己的身份感到自在时,我们就能成为所有云服务提供商的优秀合作伙伴。然后,我们希望看到他们成功。我知道这听起来有点奇怪,当我们把他们视为竞争对手时,但我们并不把他们视为竞争对手,我们把他们视为合作伙伴,他们碰巧也与我们竞争。你知道,我们为云服务提供商所做的最重要的事情之一就是为他们带来生意,而一个伟大的计算平台就是能带来生意。
Anjney Midha:我记得当我第一次和Arthur见面时,我们在伦敦的一家餐厅里,深夜还在讨论他的A轮融资计划,当时我们正在讨论他为什么需要这么多资金。现在回想起来,Mistral的A轮融资筹集了5亿美元,而其他一些公司为了达到同样的阶段却花费了数十亿美元。
当时我问他:"你们想用什么芯片来运行?"他看着我,好像我问了一个荒谬的问题一样,仿佛答案不言而喻——除了Nvidia的H100芯片,还能用什么?Nvidia投资于初创企业和创始人的生态系统,甚至在没有人知道他们之前就投资了。是什么思想在引导你如此深入地投资于初创企业和创始人,甚至在他们成名之前?
黄仁勋:我想原因有两个。首先,我很少称我们所制造的产品为GPU。虽然我们制造的是GPU,但我认为Nvidia是一家计算公司。如果你是一家计算公司,最重要的事情是开发者。我们的所有策略、行动、优先事项、聚焦点和投资,100%都与"开发者至上"的理念保持一致,这也可以被称作生态系统。
所以,一切都从这里开始,也在这里结束。我们举办开发者大会,公司内部的所有举措都是以开发者为中心的。这是第一点。
第二点是,我们当时正在开拓一种全新的计算方法,这种方法对于通用计算世界来说是非常陌生的。这种加速计算方法在很长一段时间里都是非常陌生的、反直觉的,甚至有些笨拙。因此,我们一直在寻找下一个令人惊叹的突破,下一个看似不可能实现的事情,而这些如果没有加速计算是无法做到的。
所以,很自然地,我会去寻找像Arthur这样的研究人员和伟大的思想家,因为我在寻找下一个杀手级应用。如果还有某个令人惊叹的计算机科学思想家我们还没有接触过,那肯定是我的疏忽,我们一定要去接触他们。
Anjney Midha:从计算的角度来看,你认为未来有哪些最重要的趋势?特别是对于那些可能正在领导世界上增长最快的市场的政府决策者们,他们试图了解计算的未来发展方向,你会如何指导他们?
Arthur Mensch:我们正在朝着越来越异步的工作负载发展,也就是说,你将一个任务交给AI系统,然后它会花20分钟进行研究,然后再返回结果。这肯定会在一定程度上改变你看待基础设施的方式,因为这会带来更多的负载。所以,这对我们来说是一个看好的案例,无论是对数据中心还是对Nvidia来说都是如此。正如我开始时所说,如果你没有正确的AI Agent入职基础设施,所有这些都不会发生,如果你没有一种流行的方式让AI系统了解它们所交互的人,以及如何向它们提供信息。
从与人类互动中学习的方面在未来几年将变得极其重要。还有一个方面是关于个性化的,即让模型和系统整合对用户的最佳表示,以尽可能有用的方式为他人服务。我认为我们还处于这个阶段的早期,但这种情况将深刻改变我们与机器的互动方式,这些机器将更多地了解我们的品味,了解如何为我们提供尽可能有用的服务。
我想作为总理或国家领导人,我想考虑教育,确保我有一个了解AI的本地人才库,能够创建专门的AI系统。我还需要考虑基础设施,既包括实体方面,也包括软件方面。所以,什么是正确的基础组件?与谁合作才能为你提供入(数字劳动)就职平台?这两点很重要。如果你拥有人才,并且与这群人深度合作,你的国家经济将发生深刻的变化。
黄仁勋:在过去的十年里,我们看到了计算领域的巨大变化,从手工编码到机器学习,从CPU到GPU,从软件到AI。整个技术栈、整个行业都经历了彻底的变革,而我们仍在经历这一变革。在接下来的十年里,情况将更加令人难以置信。当然,我们知道预训练很重要,而且将继续如此。但现在我们有了后训练,后训练包括思想实验、实践、辅导、指导以及我们人类用来学习的所有技能。
你知道,思考和Agent系统、信息性数字工作者AI即将出现的想法真的很令人兴奋。这对计算的意义非常深刻,这也是我们在过去……人们对我们推出Blackwall感到惊讶,原因是我们为推理构建了Blackwall,而且恰逢其时,因为思考本身是一个巨大的计算负载。
所以,有一个计算层面,还有我们将看到的AI类型。有Agent AI、信息性数字工作者AI,但还有物理AI正在取得巨大进展,以及物理AI也在取得巨大进展。物理AI当然是那些遵循并理解物理定律、原子定律、化学定律等所有自然科学的AI。
你知道,所有这些自然科学领域我们都将看到一些重大突破,这将影响工业、科学、高等教育和研究。然后还有物理AI,这些AI理解物理世界的本质,从摩擦力到惯性,因果关系,以及物体的永久性等常识性的东西,人类有常识,但大多数AI却没有。我认为这将使许多机器人系统成为可能,这将在制造业等领域产生重大影响。
美国经济非常依赖知识工作者,而许多其他国家则非常依赖制造业。因此,我认为许多国家领导人应该意识到,他们需要的能够变革和革新其行业的那些AI即将到来,他们应该保持高度警惕。
我鼓励人们不要过分敬畏技术,有时候当你过分敬畏技术时,你最终不会去参与它,你会害怕它。不要害怕。我们今天讨论的关于AI的一些内容,比如它如何缩小技术差距,这确实是一个非常重要的国家利益,你有责任去参与它。无论如何,未来令人兴奋。
本文来自微信公众号:明亮公司,作者:MD
还没有评论,来说两句吧...