其实往大点说,整个显卡市场是个三足鼎立的状态,三大巨头:英特尔市场占有率71%、英伟达17%、AMD 12%。奇怪了,怎么又闹出来个英特尔,而且市场占有率还这么高?
实际上,此显卡非彼显卡。因为这个显卡,它分为独立显卡和集成显卡,你要把这俩都放一起比,那英特尔确实是老大,但它基本上卖的全都是集成显卡,集成显卡是和CPU封装在一起的,共享内存,英特尔就利用它的CPU的垄断地位霸占着集成显卡的份额。不过集成显卡它比较弱,和英伟达这个独立显卡比起来,虽然都叫显卡,但不是一个市场。单看独立显卡,英伟达占了80%以上。
那怎么英伟达又跟AI扯上关系了?为什么这些AI公司都得买英伟达的显卡呢?这就说到显卡的特性了。
电脑里的CPU(就中央处理器),它本身的设计目的就是它什么都能干,它是顺序计算,可以进行非常复杂的逻辑推理,可是这个图形处理它其实不怎么在意顺序,更在意的是计算量,你比如说一个4k的视频,那小一千万个像素点,假设每秒30帧,那每一个像素点、每一帧都得根据它的阴影、动作计算出来一个对应的颜色,这就需要不停地进行非常快速而且大量的简单计算。
GPU(图形处理器)就专门设计出来针对这类计算的一个单元,它底层的芯片设计就是为了优化这类并行计算。所以你看CPU一般撑死了就是64核、128核,而GPU它可以有成千上万个核,一起在那计算。
就是因为GPU这个特性,黄仁勋就开始琢磨了,你说我怎么才能挖掘出它更大的潜力呢?这肯定不光是3D图像处理、渲染这么简单,我能不能进行更多通用目的的计算(General Purpose Computing),做一个通用目的的图形处理器GPGPU。
但当时你要想用GPU做通用计算其实并不是那么简单,因为毕竟本身设计就不是来干这个,所以编程非常麻烦,一般人干不了这个活。黄仁勋就想了,所以要让显卡发挥更大的潜力就得让它可编程。
一次偶然的机会,他就看见斯坦福一个博士生做了一个项目,可以用C语言编程,让这个GPU做一些计算。黄仁勋就眼前一亮,这个想法好,赶紧把这个小伙挖到英伟达工作,而且上来就委以重任,让这个小伙带队潜心研发,钻研让它编程。
终于在2006年,英伟达正式推出了CUDA,成功地让GPU可编程。为了打造这套CUDA系统,英伟达可以说是砸了大量看起来非常不理性的成本投入和人力,让英伟达几乎所有的显卡全都要支持CUDA。这样一来,原来那种专门设计用来3D处理图形的显卡要想让它拿去计算编程,本来是需要一大堆顶尖的工程师,但现在你随便找个学生买个英伟达的显卡,然后看看那个CUDA的lIBrary就能搞。
通过CUDA,英伟达就把自己显卡的边界从原来的游戏和3D图像处理扩大到了整个加速计算的领域,比如航天、生物制药、天气预报、能源勘探等等,其实都已经在用大量英伟达的显卡来进行计算了。
其实别人也尝试做类似CUDA这种软件来挑战英伟达的地位,可是英伟达人在硬件上本身就垄断了,就可以尽一切可能让硬件显卡跟软件CUDA之间的配合和融合越来越默契,就通过这种软硬件的协同来形成自己一个非常强的护城河。
说到这你是不是想到一家公司,就是苹果,他们都打造出一个被商业领域提烂的词——生态系统。此外像什么微软、Adobe,其实都是有自己强大的生态系统。
你看,黄仁勋在CUDA上这个巨额投入现在听着好像觉得非常合理,但当时要是光看短期回报是非常不合理的,华尔街就对这玩意儿相当看不顺眼,因为虽然当时GPU的计算能力非常出色,但它的应用场景太少了,很长一段时间只能集中在非常少数那种需要大量计算的领域,说白了就根本不赚钱,但谁能想到2023年人工智能这么火。
其实率先让显卡的加速计算能力实现商业价值的并不是人工智能,而是一个巧合,一个八竿子都打不着的潮流,一个黄仁勋就算自己再有远见也不可能预料到的事儿——比特币挖矿。
比特币的爆火,带来了巨大的挖矿需求,挖矿说白了就是进行大量无脑计算,而想要挖矿你要算得快,就得用显卡,而且得用英伟达的显卡。估计很多人可能就是从挖矿那会才知道说,原来显卡还能用来计算。挖矿这个巨大需求对英伟达来讲简直就是天降大饼,而且是一个大的不得了的大饼,让英伟达的显卡常年处于供不应求的状态。英伟达也非常贴心,专门给挖矿设计了GPU。
据分析师估算,英伟达在2018年到2021年比特币比较火的这段时期,每年光靠挖矿大概能赚10到30亿美元,英伟达的市值也在这段时间超过了当年不可一世的巨头——英特尔。就在比特币最火那段时候,它的市值甚至一度逼近了万亿美元。