某派
开荒者黄仁勋
下载 App
黄仁勋 · 25 年长跑 封面

黄仁勋 · 25 年长跑

创业技术押注
流派 · 开荒者
大师 · 黄仁勋
听 56 分钟解读 · 读约 11,857 字精读
在某派 App 听音频解读
一句话定位 黄仁勋用25年验证了一件事:押注正确方向,比押注正确时机更重要

这篇讲什么

1993 年那家差点倒闭的显卡公司,赌赢了 AI 时代 —— 但他押注 CUDA 的那十年,几乎没人懂他在做什么。

一九九三年,黄仁勋三十岁,坐在加州一家二十四小时营业的廉价餐厅里,用餐巾纸写下了NVIDIA这个名字。那时候没有人在乎显卡,整个行业的目光都落在英特尔和CPU上。他们的第一款产品做出来之后,因为和整个行业生态不兼容,几乎把公司拖垮。账上快没钱的时候,黄仁勋没有选择卖掉公司,而是亲自去找英特尔谈了一笔授权,续了命,然后当着全体员工的面,宣布放弃过去几年的全部技术积累,重新开始。这还只是第一个至暗时刻。更难的在后面——二零零六年,他押注了一个叫CUDA的东西,整整十年,几乎没有人看得懂他在做什么,市场不理解,投资人不理解,连业内人士也在观望。直到深度学习爆发,直到AI时代到来,那十年的孤注一掷才突然说得通了。这不是一个「天才创始人一路开挂」的故事,而是一家公司如何在反复接近死亡的边缘,靠一些笨拙却清醒的选择,撑进了正确的时代。

谁该读这一篇

本篇 6 个核心观点

试听第一章音频解读

第 1 章 · Denny's 餐厅与 NVIDIA 的诞生
知性男声 · 约 14 分钟
App 内还有 220+ 大师案例都已配音频解读 App 内继续听 →

精读全文

第 1 章 · Denny's 餐厅与 NVIDIA 的诞生

一九九三年,三个人坐在一家叫 Denny's 的连锁餐厅里,用餐巾纸写下了一家公司的名字。三十年后,这家公司的市值超过了一万亿美元。但在那个当下,他们什么都没有。你有没有想过——伟大的公司,到底是怎么从零开始撑过去的?

一九九三年的美国,最火的科技公司是英特尔。

那一年,英特尔刚刚发布奔腾处理器,整个行业都在谈 CPU,谈运算速度,谈摩尔定律。没有人在谈显卡。显卡是什么?是电脑里一块不起眼的配件,负责把信号转成屏幕上的图像。功能单一,地位边缘,没有人觉得它能成为什么大事。

但有三个人不这么看。

他们的名字是黄仁勋、克里斯·马拉科夫斯基,还有柯蒂斯·普瑞姆。三个工程师,聚在加州圣何塞的一家 Denny's 连锁餐厅里,点了咖啡,摊开纸巾,开始聊一件事:

如果有一块专门为图形计算设计的芯片,会怎样?

这就是 NVIDIA 的起点。

不是写字楼,不是投资人会议室。是一家二十四小时营业的廉价早餐餐厅,三个人,一个模糊的想法。

---

在正式进入这段历史之前,我想先带你看一眼这整个专题的地图。

我们会用四章来讲黄仁勋和 NVIDIA 的故事。

第一章,也就是今天,我们从 Denny's 餐厅那张桌子开始,讲 NVIDIA 最初的诞生,讲他们的第一款产品 NV1 如何失败,讲一家公司在最脆弱的时候是怎么活下来的。

第二章,我们跳进九十年代末那场残酷的显卡战争——Riva 128 如何让 NVIDIA 起死回生,GeForce 256 如何改写了整个行业的定义,"GPU"这个词是怎么来的。

第三章,是整个故事最反常识的一章。NVIDIA 在二零零六年推出了一个叫 CUDA 的东西,整整十年没有人懂它是干什么用的,直到深度学习爆发,直到 AlexNet,一切才突然说得通了。

第四章,我们站在 AI 时代的门口,看黄仁勋如何从一个显卡公司的 CEO 变成了整个 AI 时代的"总教练"——从 A100 到 H100,从 ChatGPT 到万亿市值,再到那件标志性的皮夹克。

好,现在我们回到一九九三年。回到那家 Denny's 餐厅。

---

黄仁勋那年三十岁。

三十岁。

他在 LSI Logic 和 AMD 各工作过一段时间,是个有经验的芯片工程师,但算不上行业明星。他后来在访谈里说过,他当时其实很清楚创业的风险。他曾坦言,如果他知道创业有多难,可能根本不会去做。但正因为年轻,正因为不知道,他才敢迈出那一步。

这句话值得停下来想一想。

很多人觉得创业者天生无畏。黄仁勋的版本不是这样的。他的版本是:无知,有时候是一种保护。

NVIDIA 成立于一九九三年四月。

公司注册了,办公室租了,但核心问题马上来了:

做什么产品?

他们锁定了游戏市场。理由很清晰——游戏需要大量图形计算,而当时的 CPU 根本不擅长这件事。如果能造一块专门处理图形的芯片,游戏体验会有质的飞跃。

逻辑上,这是对的。

但执行上,他们做了一个决定,后来几乎要了这家公司的命。

---

这个决定,叫 NV1。

NV1 是 NVIDIA 的第一款产品,一九九五年上市。

它有一个非常独特的设计:用"二次曲面"来渲染三维图形,而不是当时行业通行的"三角面"标准。

黄仁勋团队的逻辑是:二次曲面在数学上更优雅,渲染出来的曲线更平滑,理论上效果更好。

听起来很合理,对吧?

停。

问题在于,整个行业已经在往三角面标准靠拢了。微软的 Direct3D 图形接口,用的是三角面。游戏开发者,用的是三角面。

NVIDIA 造了一块芯片,和整个生态系统不兼容。

NV1 卖出去了一些,但远远不够。更要命的是,世嘉找到了 NVIDIA,希望为他们的游戏主机 Saturn 提供图形芯片支持。NVIDIA 接了这个合同,把大量资源压在了上面。

然后,世嘉 Saturn 在北美市场败给了索尼的 PlayStation。

合同泡汤了。

资金,开始告急。

---

一九九六年前后,NVIDIA 的账上已经快没钱了。

员工不到一百人。产品失败。大客户消失。

这是整个故事里第一个至暗时刻。

黄仁勋做了一件事,很多人不一定知道——他去找了英特尔。

不是去卖公司,不是去寻求收购。他去谈了一笔授权合同,拿到了一笔资金,让公司续了命。

同时,他做了一个更关键的决定:

放弃 NV1 的技术路线。

彻底放弃。

这意味着之前几年的研发投入,很大程度上清零了。意味着要向团队承认:我们走错了。意味着要在公司最虚弱的时候,重新开始。

他曾在访谈中说,那段时间他几乎每天都在想公司会不会撑不下去。但他的核心观点是:一个领导者在至暗时刻最重要的事,不是假装乐观,而是让团队清楚地知道真实的处境,然后一起找出路。

他没有对团队说"一切都好"。

他说的是:"我们有问题,这是问题所在,这是我们接下来要做的事。"

---

这种透明,在当时的硅谷文化里其实不算主流。

很多创始人的本能是保护团队情绪,报喜不报忧。黄仁勋选择了另一条路。

他后来把这个原则叫做——不要保护团队免于现实。

这句话,在他后来所有关于管理的表达里,反复出现。

---

新的方向,是 NV3。

也就是后来以"RIVA 128"为名上市的那款产品。

这一次,他们彻底拥抱了三角面标准,完全兼容微软 Direct3D,完全面向 PC 游戏市场。

不再搞特立独行的技术路线。

不再押注单一大客户。

把赌注,押在了整个 PC 游戏生态上。

一九九七年,RIVA 128 上市。

三个月,卖出了一百万颗。

这个数字在当时是什么概念?

整个显卡市场,被震动了。

NVIDIA,活下来了。

---

我想在这里停一下,做一个当下的映射。

今天,你如果去看任何一家在早期几乎死掉、后来活下来的公司,几乎都能找到类似的结构:

第一,早期押错了一个技术方向或市场方向。

第二,在最危险的时候,创始人做了一个"放弃之前所有"的决定。

第三,重新押注,这次押对了。

苹果在一九九七年差点破产,乔布斯回来之后砍掉了百分之七十的产品线。亚马逊在互联网泡沫破裂后几乎被做空到零,贝佐斯坚持了下来。

黄仁勋的版本是 NV1 到 RIVA 128。

但这里有一个很容易被忽略的细节——

放弃,不等于放弃方向。

黄仁勋放弃的是具体的技术路线,不是"为图形计算专门造芯片"这个核心判断。他从来没有说:也许我们应该去做别的。他说的是:我们的方向是对的,但这条路走错了,换一条路继续走。

这个区分,非常重要。

很多创业者在遭遇失败时,会同时放弃方向和路径。黄仁勋只放弃了路径。

---

还有一件事,关于 NVIDIA 的名字本身。

NVIDIA 这个名字,据说来源于拉丁语"invidia",意思是"嫉妒"或"渴望"。但他们在内部更常用的解读,是"NV"——Next Version,下一个版本。

这家公司从第一天起,就把自己定义为永远在迭代的东西。

NV1 失败了,NV3 来了。

NV3 成功了,下一个版本还在路上。

这种对"版本迭代"的执念,后来贯穿了 NVIDIA 整个产品哲学。每一代显卡,每一代架构,都被视为一个"版本",不是终点,是起点。

---

一九九三年到一九九五年,这三年,是 NVIDIA 最不起眼的三年,也是最关键的三年。

没有光,没有掌声,没有人在意。

只有三个人,一家餐厅,一个模糊的想法,和后来无数个几乎撑不下去的夜晚。

黄仁勋在 Denny's 餐厅的那张桌子,现在已经成了硅谷创业文化里一个小小的传说。据说那家餐厅后来在店里挂了一块牌子,标注这里是 NVIDIA 的诞生地。

但牌子是后来挂的。

在那个当下,没有人知道那张桌子会变成什么。

---

好,这是 NVIDIA 故事的第一章。一家公司从 Denny's 餐厅出发,走过 NV1 的失败,走过账上快见底的至暗时刻,靠着放弃错误路径、拥抱行业标准,用 RIVA 128 打响了第一枪。

但你有没有想过——

活下来,只是开始。

接下来,NVIDIA 要面对的是一场真正的战争。那个时代最强的显卡公司叫 3dfx,他们有 Voodoo,有市场,有口碑。NVIDIA 凭什么能赢?GeForce 256 又是怎么横空出世,把"GPU"这个词第一次写进了行业词典?

下一章,我们进入显卡战争最激烈的年代。

第 2 章 · 显卡战争与 GeForce 崛起

一九九九年,有一家公司发布了一块显卡,然后给它起了一个没人听懂的名字——GPU。不是显卡,不是图形加速器,是GPU。黄仁勋为什么要这么做?这个名字背后,藏着一场彻底改变行业格局的战略豪赌。

上一章我们讲了NVIDIA的诞生。三个工程师,一家Denny's餐厅,一个没人看好的赛道。核心是黄仁勋押注图形芯片,但第一款产品NV1惨败,公司差点在起点就倒下。今天我们来看:他是怎么从废墟里爬起来,打赢显卡战争的。

---

一九九六年。

想象一下那个画面。

NVIDIA的办公室里,工程师们几乎没有休息日。公司账上的钱,只够再撑几个月。黄仁勋知道,如果下一款产品再失败,就没有下一次了。

那时候的显卡市场,是一片真正的战场。

3dfx,当时的行业霸主。他们的Voodoo系列显卡,几乎统治了整个游戏市场。玩家们为了它排队,开发者们为它专门优化游戏。3dfx的名字,在那个年代就是"最好的显卡"的代名词。

还有S3、Matrox、ATI。每一家都在争这块市场。

NVIDIA算什么?

一家刚刚经历过惨败的小公司。

---

但黄仁勋做了一个关键决策。

他放弃了NV1时代那套"自研接口"的思路,转向微软的Direct3D标准。

这个决定,听起来简单,背后其实是一次彻底的自我否定。NV1失败的原因之一,就是NVIDIA坚持用自己的图形接口,结果和整个行业脱节。黄仁勋承认了这个错误,然后调转方向。

他的核心观点是:在标准还没确立的时候,押注错误的标准,比做出烂产品更致命。

一九九七年,NVIDIA发布了Riva 128。

速度。

这是Riva 128最大的武器。它的渲染速度,是当时市场上同类产品的好几倍。不是快一点,是快很多。

四个月。

Riva 128从发布到卖出一百万颗芯片,只用了四个月。这个速度,在当时的显卡行业是前所未有的。NVIDIA一夜之间从边缘玩家变成了必须被重视的对手。

公司活下来了。

但黄仁勋没有停。

---

接下来发生的事,才是真正的转折。

一九九九年,NVIDIA发布了一款新产品。

GeForce 256。

光看参数,GeForce 256已经很强。但黄仁勋做了一件更重要的事——他给这类芯片起了一个新名字。

GPU。

图形处理器。Graphics Processing Unit。

不是显卡。不是图形加速器。是GPU。

为什么要这么做?

因为黄仁勋想传递一个信号:这不只是一块让游戏画面更好看的配件,这是一个独立的计算单元。它有自己的处理器,自己的内存,自己的计算逻辑。它和CPU是平等的存在,不是CPU的附属品。

这个命名,是一次产品定义的革命。

在那之前,所有人都觉得显卡是电脑的边角料。CPU才是大脑,显卡只是输出图像的工具。黄仁勋用"GPU"这两个字,重新划定了边界。

他在告诉整个行业:图形计算,是一个独立的赛道。

---

与此同时,微软的Xbox项目启动了。

微软需要一块强大的图形芯片,来支撑他们即将推出的游戏主机。NVIDIA拿下了这个合作。

这是一笔意义远超金额本身的合同。

和微软合作,意味着NVIDIA的技术路线得到了行业最重要的合作伙伴的背书。意味着NVIDIA的工程师要在极限压力下,把产品做到微软要求的水准。意味着NVIDIA的名字,会出现在千万台Xbox主机里。

黄仁勋曾在某次访谈中说,和微软合作Xbox的那段时间,是NVIDIA工程能力被逼出来的阶段。外部压力,有时候比内部驱动更能让一个团队突破极限。

---

然后,3dfx倒下了。

这件事值得单独说。

3dfx曾经是这个行业的神话。Voodoo显卡是玩家心中的圣物。但是,3dfx犯了一个致命的错误。

他们决定自己做显卡,不再只卖芯片。

这意味着什么?

他们开始和自己的客户竞争。那些原本购买3dfx芯片、自己生产显卡的合作伙伴,一夜之间变成了对手。合作伙伴离开了,渠道崩了,3dfx的产品越来越难卖出去。

与此同时,NVIDIA的迭代速度越来越快。

每六个月,一款新产品。

这是黄仁勋定下的节奏。不是每年,是每六个月。这个速度,让竞争对手喘不过气。你刚刚追上我这一代产品,我下一代已经发布了。

二零零零年,NVIDIA收购了3dfx的核心资产。

曾经的霸主,就这样消失了。

---

停。

这里有一个值得细想的问题。

3dfx的失败,是因为技术不行吗?

不是。他们的技术,在某些方面甚至领先NVIDIA。

他们失败,是因为战略错误。自己做终端产品,破坏了合作伙伴关系,然后在迭代速度上被NVIDIA彻底甩开。

黄仁勋看到了这一点。NVIDIA从来没有去做自己品牌的整机,没有去抢合作伙伴的生意。他们只做芯片,只做GPU,把下游的空间留给合作伙伴。

这是一种克制。

也是一种战略清醒。

---

当下映射一下。

你有没有想过,今天的芯片行业,还在上演同样的剧本?

高通做芯片,不做手机整机。ARM卖架构,不做芯片。英伟达做GPU,不做服务器整机。

这些公司,都在用同一个逻辑:我做最核心的那一层,把其他层的空间留给生态伙伴。

生态,比独吞,活得更久。

黄仁勋在二零零零年就想清楚了这件事。

---

到二零零五年,NVIDIA已经是显卡市场无可争议的领导者。

GeForce系列,成了游戏玩家的标配。每一代新产品发布,都是游戏媒体的头条。NVIDIA的名字,从一个玩家才知道的小品牌,变成了科技行业里响当当的名字。

但黄仁勋的野心,不止于此。

他在这个阶段,开始思考一个更大的问题:GPU除了渲染游戏画面,还能做什么?

这个问题,在当时没有人能给出答案。

甚至他自己的团队,也有很多人觉得这个问题问得奇怪。GPU就是用来做图形的,还能做什么?

但黄仁勋在这个问题上,花了越来越多的时间。

他注意到一件事:GPU内部有大量并行计算单元。渲染图形,本质上是同时处理海量像素的并行计算。这种并行计算的能力,理论上可以用在图形以外的场景。

这个想法,在二零零五年还只是一颗种子。

但它即将长成一棵改变整个科技行业的大树。

---

那么问题来了。

GPU的并行计算能力,到底能用在哪里?黄仁勋决定为此押上多大的赌注?这个赌注,在接下来整整十年里,几乎没有人看懂。

下一章,我们来讲CUDA——一个被市场冷落了十年,却最终引爆AI时代的反共识决策。

第 3 章 · CUDA 的反共识赌局

二〇〇六年,NVIDIA 做了一个没有人看好的决定。他们要把图形芯片,变成一台通用计算机。这个想法,整整十年,没有人懂。但黄仁勋等到了。他等到了什么?

上一章我们讲了显卡战争。NVIDIA 从废墟里爬起来,用 Riva 128 绝地反击,打倒了 3dfx,又用 GeForce 256 发明了"GPU"这个概念。核心是一件事:黄仁勋赢了游戏市场,NVIDIA 活下来了。今天我们来看:活下来之后,他做了一个让所有人都看不懂的赌注。

---

停。

先问你一个问题。

如果你的公司刚刚打赢一场生死战,市场份额第一,产品卖得正好——你会怎么做?

大多数人的答案是:继续做。继续卖游戏显卡,继续优化性能,继续赚钱。

黄仁勋没有。

---

二〇〇六年,NVIDIA 对外发布了一个叫做 CUDA 的东西。

全称是 Compute Unified Device Architecture,统一计算设备架构。

听起来很学术。

但它的意思,其实非常激进:

GPU 不只是用来渲染游戏画面的。

它可以用来做任何计算。

---

想象一下那个时代的背景。

二〇〇六年,iPhone 还没有发布。云计算还是个新词。大多数人对"芯片"的理解,就是电脑里那块 Intel 的处理器,也就是 CPU。

CPU 是什么?是一个超级聪明的单线程工人。一次只做一件事,但做得又快又精准。

GPU 是什么?是几千个没那么聪明的工人,同时干活。渲染游戏画面,本质上就是同时计算屏幕上几百万个像素的颜色。GPU 天生就是为"并行计算"而生的。

黄仁勋的洞察是:

这种并行能力,不只是游戏需要。

科学计算需要。物理模拟需要。气象预报需要。任何需要同时处理海量数据的任务,都需要。

---

但问题来了。

GPU 当时的编程方式,极其痛苦。

工程师如果想用 GPU 做非图形计算,必须把自己的问题"伪装"成图形问题,用图形 API 来骗过 GPU。这就像你想用一把锤子拧螺丝——不是不行,但你得先把螺丝改造成钉子的形状。

CUDA 要做的,就是给 GPU 一套真正的通用编程接口。

让工程师可以直接对 GPU 说:帮我算这个矩阵乘法。

不用再伪装了。

---

这个决定,在公司内部不是没有争议的。

显卡业务正在赚钱。游戏市场是真实的、可见的、增长的。

而 CUDA 要服务的客户是谁?

是大学里的科研人员。

是气象局。

是做流体力学模拟的工程师。

这些人,买的显卡数量,加起来可能不如一个游戏发行商的一个季度。

凭什么为他们花这么大的力气?

黄仁勋的核心观点是:市场不是被发现的,是被创造的。你要先把工具造出来,才能看到工具能干什么。

---

于是 NVIDIA 开始了一场漫长的布道。

他们派工程师去高校,手把手教授如何用 CUDA 编程。

他们写文档,做教程,办研讨会。

他们给研究人员免费提供硬件。

这不是市场营销。这是基础设施建设。

NVIDIA 在做的,是把自己的 GPU 变成一个平台——就像微软把 Windows 变成平台一样。

但问题是,这个平台,整整沉寂了将近十年。

---

十年。

不是十个月。

是十年。

---

从二〇〇六年到二〇一二年,CUDA 的用户群体,主要还是科研圈子里的小众人群。

这期间,NVIDIA 的股价起起落落。分析师们不断追问:你们的 GPU 计算业务,什么时候能赚钱?

黄仁勋的回答,始终是某种版本的"等着看"。

他曾在多次访谈中表达过这样的观点:他不相信季度财报能反映真正的战略价值。他相信的,是技术积累的复利效应。

但坦白说,在二〇〇九年、二〇一〇年,如果你是 NVIDIA 的股东,你很难不焦虑。

---

然后,二〇一二年来了。

多伦多大学。

一个叫亚历克斯·克里热夫斯基的博士生,和他的导师杰弗里·辛顿,用 GPU 训练了一个神经网络。

这个神经网络,参加了当年最权威的图像识别竞赛,叫做 ImageNet。

结果出来了。

错误率:

百分之十五点三。

其他所有参赛队伍,错误率都在百分之二十五以上。

差距不是小小的进步。

是降维打击。

---

这个神经网络,后来被叫做 AlexNet。

它用了两块 NVIDIA 的 GTX 580 显卡来训练。

就是普通消费者买来玩游戏的那种显卡。

但它做到了人类历史上从未有过的图像识别精度。

---

停。

想想这意味着什么。

黄仁勋等了六年。

六年里,CUDA 被大多数人忽视。

然后,一篇论文,改变了整个计算机科学的走向。

深度学习,从学术界的边缘话题,变成了全球科技公司最热门的赛道。

而训练深度学习模型,最需要的东西是什么?

并行计算能力。

也就是 GPU。

也就是 CUDA。

---

NVIDIA 突然发现,他们六年前造的那把锁,刚好配上了全世界最重要的那把钥匙。

不,说反了。

是他们六年前造的那把钥匙,刚好配上了全世界最重要的那把锁。

---

接下来发生的事,你可以想象。

谷歌来了。

Facebook 来了。

微软来了。

全世界的 AI 实验室,开始疯狂采购 NVIDIA 的 GPU。

不是一块两块。

是几千块,几万块。

---

但这里有一个细节,值得单独拎出来说。

NVIDIA 能接住这波需求,不只是因为运气。

是因为他们在那十年里,从未停止对 CUDA 生态的投入。

他们建立了一套完整的软件库。

cuDNN,专门为深度神经网络优化的计算库,二〇一四年发布。

这个库,让研究人员不需要自己从头优化底层代码,直接调用就能跑出接近硬件极限的性能。

这是护城河。

不是硬件护城河,是软件生态护城河。

---

你可以买到其他公司的 GPU。

但你买不到 CUDA 生态里十年积累的工具链、教程、社区、和兼容性。

这就是为什么,即使后来 AMD、英特尔都在追赶,AI 训练的主流平台依然是 NVIDIA。

黄仁勋曾经在某次访谈中说过,他认为软件是 NVIDIA 最深的护城河。硬件可以被复制,生态不能。

---

当下映射一下。

今天,很多公司在谈"AI 战略"。

但大多数公司做的,是在 AI 热潮来了之后,赶紧宣布自己要做 AI。

NVIDIA 做的,是在 AI 热潮来临的十年前,就开始建设 AI 需要的基础设施。

这两种姿态,本质上是不同的。

一个是追风口。

一个是造风口。

黄仁勋的核心观点是:你永远不知道平台会在什么时候爆发,但你知道如果平台不存在,爆发就不会发生。所以先把平台建起来。

---

还有一个细节,很少被提到。

CUDA 推出的时候,NVIDIA 内部有人担心:如果 GPU 变成通用计算平台,会不会反而稀释了游戏显卡的品牌定位?

黄仁勋的决定是:两个市场同时做。

游戏继续做,而且要做得更好。

但 GPU 计算,要作为独立的战略方向,配置独立的团队、独立的产品线、独立的客户关系。

这个组织决策,后来被证明是正确的。

游戏业务持续盈利,为 GPU 计算业务的长期投入提供了现金流支撑。

而 GPU 计算业务,在沉寂十年后,成为了公司最重要的增长引擎。

---

二〇〇六年到二〇一五年。

这是一段很难用财报来衡量价值的时间。

没有爆炸式的营收增长。

没有媒体头条。

只有一群工程师,在高校的机房里,耐心地教研究人员怎么用 GPU 算矩阵。

但就是这段时间,奠定了 NVIDIA 后来一切的基础。

---

这让我想到一个问题,留给你思考:

什么样的组织,才能在看不到回报的十年里,坚持做一件事?

不是因为有人逼它。

是因为它真的相信这件事值得做。

这种信念,从哪里来?

---

但信念本身,并不足以解释 NVIDIA 后来的成功。

黄仁勋还做了另一件事。

他重新定义了这家公司的组织结构和领导哲学。

他是怎么带领一家芯片公司,变成 AI 时代的基础设施提供商的?

他的"皮夹克哲学"背后,藏着什么样的管理逻辑?

Volta、A100、H100,这些代号意味着什么?

ChatGPT 爆发的那一刻,NVIDIA 内部发生了什么?

这些问题,我们下一章见。

第 4 章 · AI 时代的总教练

一家公司押注了十年,全世界没几个人看懂。然后,一夜之间,世界变了。ChatGPT 横空出世,所有人突然发现:那个"看不懂的赌注",早已悄悄赢了。黄仁勋是怎么撑过那十年的?他又是怎么在 AI 爆发的前夜,再一次押对了?

上一章我们讲了 CUDA 的反共识赌局。黄仁勋在 NVIDIA 如日中天的时候,悄悄把资源押向一个没人看得懂的方向——通用并行计算。整整十年,CUDA 像一颗种子埋在地下,外界看不见,公司内部也有人质疑。直到 2012 年,AlexNet 横空出世,深度学习引爆,所有人才猛然回头,发现 NVIDIA 已经站在山顶上了。

今天我们来收尾。

种子发芽之后,故事才真正开始。

---

**二〇一六年。**

那一年,黄仁勋做了一件让人印象深刻的事。

他亲手把一块 GPU 交到了埃隆·马斯克手上。

不是在发布会上。是在特斯拉的工厂里,当着摄像机的面,他把 NVIDIA 的第一台 DGX-1 超级计算机,作为礼物,送给了 OpenAI。

这台机器的标价是:十二万九千美元。

但黄仁勋说,这是"送给人类未来的礼物"。

你可以觉得这是公关秀。但你也可以换一个角度看——他在向整个 AI 圈发出一个信号:NVIDIA 不是卖硬件的,NVIDIA 是 AI 基础设施的建造者。

这个定位的切换,是后来一切的起点。

---

**Volta 架构:为 AI 重新设计芯片**

二〇一七年,NVIDIA 发布了 Volta 架构。

停。

这不是一次普通的芯片迭代。

Volta 里面,有一个全新的东西,叫"Tensor Core"——张量核心。它是专门为深度学习的矩阵运算设计的。换句话说,NVIDIA 第一次在芯片层面,为 AI 计算开了一条专属通道。

这意味着什么?

以前的 GPU 是"通用的"——游戏、科学计算、AI,都能跑,但都不是最优的。Volta 之后,NVIDIA 开始走一条路:我不光给你一块能用的芯片,我给你一块专门为 AI 训练优化的芯片。

性能提升了多少?

和上一代相比,AI 训练速度提升了大约十二倍。

十二倍。

这不是小步迭代,这是代际跳跃。

---

**组织的变化:从卖芯片到卖"平台"**

但黄仁勋真正厉害的地方,不只是芯片。

他在这个阶段做了一个关键的组织决策:把 NVIDIA 的业务逻辑,从"卖硬件"重新定义为"卖平台"。

什么意思?

CUDA 是软件生态。NVLink 是芯片互联技术。DGX 是整套服务器系统。InfiniBand 是高速网络。后来还有 NeMo、Triton,是 AI 开发框架。

他把这些东西全部打包,形成一个完整的"AI 计算栈"。

你买的不是一块芯片。你买的是一套从底层硬件到上层软件、端到端的 AI 开发环境。

这个逻辑,和苹果当年做 iPhone 生态系统,有异曲同工之处。苹果不只卖手机,卖的是整个 iOS 生态。NVIDIA 不只卖 GPU,卖的是整个 CUDA 生态。

一旦开发者用习惯了这套工具,迁移成本极高。

这就是所谓的"护城河"——不是靠垄断,是靠让你离不开。

---

**二〇二〇年:A100 的诞生**

然后,A100 来了。

二〇二〇年,NVIDIA 发布了基于 Ampere 架构的 A100。

这款芯片,后来成了全球 AI 训练的标准配置。

全球几乎所有的大型语言模型——包括 GPT 系列、谷歌的 PaLM、Meta 的 LLaMA——早期训练都跑在 A100 上。

你可以这样理解:如果 AI 是一场工业革命,A100 就是那台蒸汽机。

但黄仁勋没有停下来庆祝。

他在 A100 发布之后,立刻启动了下一代的研发。

---

**二〇二二年十一月三十日。**

ChatGPT 上线了。

五天之内,用户数突破一百万。

两个月之内,突破一亿。

这是人类历史上增长最快的消费级应用。没有之一。

世界炸了。

所有人突然意识到:AI 不是科幻,AI 就在眼前。

然后所有人同时转过头,问了一个问题:

谁有 GPU?

答案只有一个。

NVIDIA。

---

**H100:踩准节拍的那一脚**

等等。

这里有一个细节,很多人忽略了。

ChatGPT 爆发的时候,NVIDIA 已经准备好了下一代芯片——H100,基于 Hopper 架构。

H100 在二〇二二年三月就已经发布。

ChatGPT 是二〇二二年十一月。

也就是说,当全世界突然涌来疯狂的 AI 算力需求时,NVIDIA 的新一代产品,已经在产线上了。

这不是运气。

这是一家公司长期押注、持续迭代的结果。

H100 相比 A100,AI 训练性能提升了大约三倍。但更重要的是,它支持更大规模的模型训练,支持更高效的多卡互联。

换句话说,它是专门为"训练 GPT 这种级别的大模型"而生的。

黄仁勋曾在某次访谈中说,他的核心观点是:你必须在市场爆发之前就准备好,因为等市场爆发了再准备,已经太晚了。

H100,就是这句话最好的注脚。

---

**万亿市值:数字背后的意义**

二〇二三年五月三十日。

NVIDIA 的市值,突破了一万亿美元。

一万亿。

加入了苹果、微软、谷歌、亚马逊的行列。

这是半导体公司历史上从未有过的高度。

但我想说的不是这个数字本身。

我想说的是:这个数字意味着什么?

它意味着,全世界的资本,在同一时刻,对一件事达成了共识——AI 时代真的来了,而 NVIDIA 是这个时代最不可替代的基础设施。

从一九九三年在 Denny's 餐厅写下创业计划,到二〇二三年市值破万亿。

整整三十年。

---

**皮夹克哲学:领导者的操作系统**

讲到这里,我们不得不说说黄仁勋这个人。

他有一件标志性的黑色皮夹克。

几乎每次公开亮相,都是这一件。

这不是时尚选择,这是一种信号。

他曾在某次采访中谈到,他的核心观点是:领导者的工作,不是管理资源,而是传递清晰度。你必须让每一个人都知道,公司在往哪里走,为什么往那里走,现在最重要的事是什么。

NVIDIA 内部有一个著名的管理实践。

黄仁勋不相信传统的层级汇报结构。他的直接汇报人,据说多达数十人。

这听起来很反常识。

一般的管理学教科书会告诉你,一个领导者的直接汇报人不应该超过七个,否则会失控。

但黄仁勋的逻辑是:扁平化让信息流动更快。中间层越多,信息失真越严重,决策越慢。在一个技术迭代极快的行业,慢就是死。

他还有一个著名的观点,关于"优先级"。

他的核心观点是:在任何时刻,公司只有五件最重要的事。领导者的工作,就是不断地问自己:这五件事是什么?这周有没有变化?

这种极度专注的工作方式,贯穿了 NVIDIA 整个发展历程。

从 NV1 失败之后的绝地求生,到押注 CUDA 的十年孤独,再到 AI 爆发前夜的产品准备——每一次,他都在做减法,把资源集中到最重要的那一两件事上。

---

**当下映射:每一家公司都面临的问题**

这里有一个值得所有人思考的映射。

不只是科技公司,任何一家公司,都会面临一个时刻:

现在的业务正在赚钱。

但未来的机会,需要你现在就开始投入,而且短期内看不到回报。

你怎么选?

大多数公司的答案是:等看清楚了再说。

黄仁勋的答案是:在别人看清楚之前,你必须已经准备好了。

CUDA 押注了十年。Volta 到 H100,每一代都在为"还没爆发的需求"做准备。

这不是赌博。

这是一种系统性的、长期主义的经营哲学。

代价是什么?是在漫长的等待期里,承受外界的质疑,承受内部的压力,承受市场的不理解。

但一旦时机到来——

你已经在那里了。

---

**整书收束**

回头看这四章,我们从 Denny's 餐厅的一张餐巾纸,走到了万亿市值的 NVIDIA。

第一章,是生存——从零开始,押注游戏显卡,在 NV1 的废墟里找到活下去的方式。

第二章,是崛起——打赢显卡战争,用 GeForce 256 定义了 GPU 这个概念,NVIDIA 有了真正的地基。

第三章,是转型——在最好的时候做最难的事,用 CUDA 押注通用计算,十年孤独,等待深度学习引爆。

第四章,是收获——但"收获"这个词,其实说得不够准确。

因为黄仁勋从来没有停下来"收获"。

A100 之后有 H100,H100 之后还有 Blackwell。每一次市场以为他已经到顶了,他又往前走了一步。

这本书真正想告诉我们的,不是一个成功者的故事,而是一种经营者的时间观——

不要为今天的市场建造今天的产品。

要为明天的世界,在今天就准备好。

不要为今天的市场建造今天的产品。—— 黄仁勋经营哲学提炼,贯穿 NVIDIA 三十年发展历程

本篇出现的关键概念

CUDA (Compute Unified Device Architecture)
NVIDIA于2006年推出的通用并行计算平台和编程模型,允许开发者直接调用GPU的并行计算单元执行非图形任务。在CUDA出现之前,工程师必须将计算问题伪装成图形问题才能借用GPU算力。CUDA本质上是将GPU从专用图形芯片升级为通用计算加速器,是NVIDIA在AI时代建立护城河的核心基础设施。
GPU (Graphics Processing Unit)
图形处理器,由黄仁勋在1999年发布GeForce 256时正式命名并推广这一概念。GPU与CPU的核心差异在于计算架构:CPU是少量高性能核心的串行处理器,GPU是数千个相对简单核心的并行处理器。这种并行架构天然适合同时处理海量数据,使其后来成为深度学习训练的核心硬件。
并行计算 (Parallel Computing)
同时执行多个计算任务的处理方式,与串行计算相对。GPU天生为并行计算设计,因为渲染图像需要同时计算屏幕上数百万个像素的颜色值。黄仁勋发现这种并行能力可以超越图形场景,用于矩阵运算、物理模拟和神经网络训练等领域,这一洞察是CUDA诞生和NVIDIA进入AI时代的起点。
ImageNet竞赛
学术界最具权威性的图像识别基准测试,全称ImageNet Large Scale Visual Recognition Challenge。2012年,多伦多大学博士生亚历克斯·克里热夫斯基与导师杰弗里·辛顿使用GPU训练的神经网络AlexNet参赛,将错误率降至15.3%,而其他参赛方均在25%以上。这一结果被视为深度学习时代正式到来的标志性事件,也是CUDA十年投入的第一次公开验证。

关于黄仁勋

黄仁勋

黄仁勋1963年生于台湾台南,九岁随家人移居美国。他在俄勒冈州立大学取得电子工程学士学位,后在斯坦福大学获得电气工程硕士学位。毕业后他先后在AMD和LSI Logic担任芯片工程师,积累了扎实的硬件设计经验。1993年,三十岁的黄仁勋与克里斯·马拉科夫斯基、柯蒂斯·普瑞姆在加州圣何塞一家Denny's连锁餐厅创立NVIDIA,从此再未离开这家公司,成为硅谷任职时间最长的科技公司创始人CEO之一。他的职业生涯分为几个清晰的阶段:1993年至1997年是生死存亡期,NV1失败几乎耗尽公司资源,RIVA 128的成功才让NVIDIA站稳脚跟;1997年至2006年是市场主导期,GeForce系列建立品牌,击败3dfx确立显卡领导地位;2006年起进入长期押注期,推出CUDA平台并坚持十年布道,在市场看不懂的阶段持续投入。2012年AlexNet事件成为NVIDIA命运的转折点,此后公司从游戏硬件公司被重新定价为AI基础设施公司。黄仁勋的管理风格在硅谷相对罕见:他强调对团队的极度透明,拒绝以保护情绪为由隐瞒真实处境;他有意保持扁平化汇报结构,据报道有超过四十位直接汇报人;他对技术路线的长期执着使他多次承受来自资本市场的短期压力。他标志性的黑色皮夹克在AI热潮中已成为一个文化符号,但在行业内更被认可的,是他在CUDA上那十年几乎孤独的坚持。

查看黄仁勋全部投资笔记 →

本篇 6 句最值得抄进笔记的话

常见问题

NVIDIA最初是做什么的,和现在的AI业务有什么关系
NVIDIA成立于1993年,最初专注于为PC游戏设计图形芯片。1995年第一款产品NV1失败,1997年RIVA 128才让公司站稳脚跟,1999年GeForce 256正式确立GPU概念。与AI的关联始于2006年推出的CUDA平台——这套通用并行计算架构让GPU可以执行非图形任务。2012年,多伦多大学使用NVIDIA GPU训练的神经网络AlexNet在ImageNet竞赛中错误率仅15.3%,远低于其他参赛方的25%以上。此后深度学习对GPU算力的需求爆发,NVIDIA从游戏硬件公司逐步转型为AI时代的核心基础设施提供商。
CUDA是什么,为什么对AI这么重要
CUDA是NVIDIA于2006年推出的并行计算平台,全称Compute Unified Device Architecture。它的核心作用是让开发者可以直接用编程语言调用GPU的并行计算单元,而不必将计算问题伪装成图形渲染任务。GPU内部有数千个计算核心,天然适合同时处理海量数据,而深度学习的训练过程本质上是大规模矩阵运算,完全契合这一架构。CUDA提供了工具链、文档和生态系统,使研究人员可以高效开发GPU加速的算法。当2012年深度学习需求爆发时,基于CUDA积累的六年软件生态成为竞争对手短期内无法复制的壁垒。
3dfx是怎么输给NVIDIA的
3dfx在1990年代中后期是显卡市场的绝对霸主,其Voodoo系列几乎统治了游戏玩家市场。失败的直接原因是一个战略误判:3dfx决定自己生产完整显卡,进入终端市场,而不再只提供芯片给合作伙伴。这导致原本购买3dfx芯片自行生产显卡的硬件厂商一夜间变成竞争对手,渠道体系随之瓦解。与此同时,NVIDIA坚持每六个月发布一代新产品的迭代节奏,持续压缩3dfx的追赶空间。2000年,NVIDIA收购了3dfx的核心知识产权和技术资产,曾经的行业神话就此终结。
黄仁勋说的不要保护团队免于现实是什么意思
这是黄仁勋在1996年公司至暗时刻形成的管理原则。当时NVIDIA账面资金告急、NV1失败、主要客户世嘉合同泡汤,公司面临真实的生存威胁。黄仁勋选择对团队如实呈现处境,包括资金状况、产品问题和市场困境,而非以稳定军心为由过滤信息。他的逻辑是:领导者的职责不是管理团队的情绪,而是和团队共同面对现实并找出路。他在传递坏消息的同时,同步提供了明确的下一步行动方向,即放弃NV1技术路线,全力开发新产品。这一原则后来成为他在多个场合反复强调的管理立场。
NVIDIA为什么市值能超过一万亿美元
NVIDIA万亿市值的基础由多个长期决策叠加形成。第一,2006年推出CUDA并坚持十年布道,使NVIDIA在AI训练硬件领域建立了软件生态护城河,后来者复制硬件较易,复制开发者生态极难。第二,从1999年起坚持每六个月迭代一代产品的节奏,持续保持算力领先。第三,始终专注芯片和架构层,不进入下游整机市场,维持了与服务器厂商、云计算平台的合作关系。2023年ChatGPT引发的生成式AI热潮使GPU需求急剧扩张,A100和H100系列数据中心GPU成为稀缺资源,NVIDIA的营收和利润在此阶段出现跨越式增长,市值随之突破万亿美元。

读完这篇,你还会喜欢

在某派 App 继续学习
220+ 大师案例 · 知性男声音频解读 · AI 对话讨论 · 流派归属测评
完整音频版 10 大投资流派 30+ 大师 离线收听 流派测评
下载某派 App
App Store 评分 4.7 · 已上架美区中文
在某派 App 听 56 分钟完整音频解读
含 220+ 大师案例 · AI 对话 · 流派测评
打开 App