人工智能发展的实在是太迅猛了,迅猛到我都感觉有点脊背发凉。ChatGPT刚成了全球大爆款,你本来以为这就是个小高潮了,结果生成式AI的发展,就好像天马流星拳一样,噼里啪啦往你脸上砸。
3月14日,谷歌发布大语言模型接口PaLM API。
3月15日,OpenAI发布了ChatGPT的升级版GPT4。接着微软就宣布要把GPT4融入到他的办公全家桶里。
3月16号,百度又发布了文心一言,打响了国内大语言模型发布的第一枪。
同一天,图片生成公司Midjourney发布了第五版。
之后华为、阿里、360、商汤也都纷纷发布了自己的大语言模型。更关键的是,现在大家推出的已经不光是这些底层的基础大模型,而是开始逐渐把这些模型都加入到应用里边来。
这种可怕的发展速度,真的是让人又兴奋,还又有点担忧。
马斯克早在2018年就放话了:“记住我的话,AI比核武器还要可怕得多。”
不管怎么说,你看它现在的发展趋势,已经势不可挡。

今天这段视频,我其实不太想去强调或者对比这些公司之间的竞争,因为很多东西确实太早期,产品也不够成熟,而且很多还在内测阶段,非得比出个谁优谁劣其实意义也不大。咱就来看一看最近到底有哪些千奇百怪的突破和应用和产品。
其实像人工智能、机器学习早就已经挺普遍了,但之前大部分是专注在分析类的工作,比如说大数据分析、AlphaGo下棋、人脸识别等等。可这波火的是什么?叫生成式AI,Generative AI,就是能生成全新内容的AI,比如说全新的文字、图片,全新的代码、声音、视频等等。
也就是说,AI它已经具有一定的创造力了,而且它创造出来的东西还真挺像那么回事,这就离真正意义上那个人工智能又迈进了一大步。
咱首先还是从大语言模型来看,这里边首先要聊的肯定就是GPT4,也就是ChatGPT的更新版,你交了钱升级到ChatGPT Plus,就可以用这个GPT4了。我都已经给它们想好之后的名了,什么ChatGPT Pro、ChatGPT Max、ChatGPT Pro Max。
咱之前其实详细聊过ChatGPT(《从图灵测试、机器学习到人工神经网络,ChatGPT颠覆了什么?》),也就是GPT3.5,就它已经几乎可以回答任何问题了,也能编程、总结等等,当然这个准确率还不能保证。
那GPT4有什么升级呢?
最明显的升级就是:它能看懂图了。
不光能识别这个图里的物体,关键是它还特别有常识,而且还有一点幽默感,这挺可怕的。不地目前图片只对API接口开放。
除了图片输入,ChatGPT还有一个很大的升级,就是它回答的准确性得到了大幅加强。
除了这两点,GPT4还有一堆改进,比如更高的字数限制,更好地去规避违禁内容,降低成本等等。
你可能对ChatGPT回答问题的能力已经见怪不怪了,但GPT4就玩得更花,像什么生成Swift代码做动画,做贪吃蛇小游戏,生成律师函,生成以太坊的智能合约等等。关键是,这些产品的提升发生在仅仅不到半年之内。考试分数就已经能从垫底变到优异,从小学生变成大学生了。你想想,它要再发展个两年能变成什么样。那估计很有可能就能超过大部分的人类或者专家了。
至于这个GPT4,它为什么发展这么快,它模型上怎么改进,它用了多少参数,现在这个Open AI,它已经完全不公布了。之前它是个非盈利组织,你看那GPT2甚至都是开源的。微软投资之后,就完全变成一家私营公司了。你想市场竞争那么激烈,这些还都是商业机密,那我就什么都不说了,甚至连参数量我都不告诉你。
大语言模型上,Open AI的GPT4,肯定是有先发优势。但是各大其他厂商都拼了命想赶上这班车,只要有能力的都会去训练自己的大模型。比如谷歌的PaLM、LaMDA,百度的文心一言,阿里的通义千问,Meta的LLaMA,华为的盘古,还有Open AI有个前员工自己出来做的Claude等等。
市场上已经出现了几十个大模型,光谷歌就七八个。但你也别以为这个东西这么贵,就只有那些巨头公司才能干,斯坦福大学基于Meta的大模型,用了600美元,就精调出了自己的大模型,叫做羊驼Alpaca,也可以叫草泥,就达到了和GPT3.5类似的水平,而且它的代码是开源的。可能很快每个人都能拿手机训练自己的大模型了。
那这些模型具体谁好谁坏呢?其实也很难说。现在看来,大家普遍认为还是ChatGPT相对来讲更成熟一些。但你看这玩意发展得这么快,指不定半年之后又有什么天翻地覆的变化呢?每家都说自己有一些独特的地方,这个正是机器学习,它训练出来模型一个非常大的特点,很难像对比什么手机电脑,后者至少可以先拿个参数拉出来看一看,能有个大概的分级。
大语言模型这玩意,你也不知道它里边具体的那个生成逻辑,你最多就能拿参数量来比一比,是几百亿、上千亿还是上万亿,但这个也不一定准,而且这东西都是企业说多少是多少,你也不知道真的假的。
咱们刚才聊的这些,其实都是那些底层的大模型。它们追求的就是那种通用性,就有点像小孩都学的这种通识教育。但是你要想训练某个专业领域的人工智能,当然你也可以自己训练。比如有些财大气粗的公司,像金融巨头Bloomberg,它就这么干了。
但中小公司肯定没这个实力,那它们就可以基于现在已经训练好的这些大模型来进行一个二次训练。就相当于你把刚刚上完通识教育小孩给拉过来,根据自己的数据,再给他上几年专业课,让他变成这个行业的专家。或者你就干脆调用这些大模型的API接口,把它变成自己服务的一部分,就是说它的可延展性其实是非常强的。
再往后,它就不是说简单聊聊天,给你生成几张美女图片那么点事儿了。关键就是,它潜在的应用范围是非常广的,很可能渗透到整个市场。
这个其实就是为什么ChatGPT还有谷歌那个PaLM,它开放API接口,其实是个非常重大的事情。那咱来看一看,目前它的一些应用方向。
最典型的例子就是搜索,这我相信大家都熟。你看微软就把ChatGPT融入到它的搜索引擎Bing里头,现在叫New Bing。谷歌就把LaMDA模型和PaLM模型都融入到了BARd的里头,差不多也算半个搜索工具了。除此之外还有像什么You.com、百度、360等等,这就相当于一个传统的搜索引擎变成了一个可以能跟你这么对答对话的机器人了。
还有一个非常适用的领域,就是办公。你想,大语言模型它最擅长的就是组织语言。那你工作的时候,让它帮你组织个上下文,写写总结,改改语法错误什么,这些肯定都是我们能想到最直观的应用。比如说Notion,它就是个挺大的记笔记的软件,今年年初就推出了Notion AI,之后一炮走红,其实就是把ChatGPT给接进来了。
微软同时手握着Office全家桶和ChatGPT两大王牌,很自然的在3月16号的时候就推出了Microsoft 365 Copilot,GPT-4就嵌到了像是Excel、Word、PoWerPoint、Outlook等办公软件里头。
比如说你在One Note里面记了个笔记,然后你在Word里头就可以让AI帮你自动生成内容和总结。你要调整好这段文字加详细了之后,这个PowerPoint又自动能帮你生成一个对应的PPT,格式也都挺好看的,而且它还自动帮你做点动画什么的。像Excel里边,你一堆数据,你就可以直接问它这是有什么特点,能不能给我做一个什么展示报告等等。
当然咱说的挺玄乎,畅想的很美妙,但以现在的AI的能力,它适用的范围肯定还没有达到那么广。但还是那句话,它之后的可能性非常之大。
已经有公司让AI去当CEO了。去年8月国内游戏公司网龙就任命它的高管唐钰出任公司的轮值CEO,而这个唐钰,你看有名有姓的,竟然是个数字虚拟人,就成了一个无处不在可以随时响应的CEO。
生成AI还有一个应用方向就是图片生成。其实它已经不光是应用层了,因为它本身基于的那个模型就已经不是大语言模型了。我相信大家可能多多少少都见过AI生成的图片,就是你跟它描述一下想要什么,或者你给它一个样片,它就能生成一个极其逼真的图片,或者各种你想要的风格,什么迪士尼风格、剪纸风格、毕加索风格、油画等等,几秒钟就能出来。
现在目前比较主流的除了Midjourney,还有OpenAI的DALL·E 2、Stable Diffusion等等。而我们知道,图形处理界的王者是谁呢?对,就是Photoshop。Adobe也推出了自己家的图像生成模型,叫Firefly。它就是把图像生成跟图像处理再一结合,那想象空间就大很多了。
除了图片生成,当然还有视频生成的AI。就比如说有个叫Runway的,你给它几个字或者给它一张图,它就能自动给你生成一段视频。
再比如说音乐创作,我就可以根据我想要的什么风格、速度、Key来创作我想要的音乐。
关键让我震惊的,不光是说它生成出来的这个结果,而是它进化的这个速度。比如说两个月之前,AI画出来的那个手指头还是乱七八糟、惨不忍睹的,你看现在就已经差不多了。估计再过不了几年,咱们看到的很多图片、视频、音频可能都是AI创作的了,或者至少说会有AI的大量参与。
还有一个应用方向,就是金融。我们刚才提了一嘴,金融从业者很熟悉的Bloomberg(彭博),人家就用自己数十年海量的数据、500亿的参数,训练出来的一个金融的专家,叫Bloomberg GPT。据说测试效果还不错。
其实国内大量的银行、券商也都多多少少宣布自己要接入各种GPT,这其中尤其是同花顺,它的AI其实布局算比较早的。虽然人家公司明面上都说了,我们公司的技术跟国际的先进水平还有着比较大的差距,但是你看这股票都已经翻倍了,可见市场对AI在金融领域的应用有多么看好。
还有一个在AI圈特别流行的,算是应用吧,就叫AutoGPT。可能翻译成叫自主机器人,这个还挺有想象力的。它不是一个面对消费者的应用,而是一个大牛直接在Github上面放了一个开源的项目,接入了GPT-4的接口,然后就可以做出来一个自主运行的机器人。
比如说你只要给它个目标,打个比方,就说你帮我弄个生意,让它持续不断地赚钱,然后剩下的,你就交给这个AutoGPT就全都搞定了。是不是听着有点太神奇了?那它的原理是什么呢?它不是像ChatGPT这种直接给你个答案,因为我们知道很多情况下,GPT说的也不靠谱。它其实基本上给GPT-4接上了编程能力、搜索能力、长期记忆能力等等。你就只需要给他一个目标,他就自己问自己问题应该怎么做,然后去执行。有什么不懂的需要做调研的,它就自己上网上去搜,然后通过不断的自己给自己提问和优化中间的环节,来尽量实现你给的目标。
还有一些其他方向的应用,比如教育。因为AI非常擅长语言,那它不就很适合当虚拟老师教人语言吗?像多邻国就接入了GPT-4,叫做Duolingo Max。还有像电商领域的,像Shopify,就接入了ChatGPT来帮助商家去写那些详细的产品介绍。
对了,还有编程方向必备的编程神器Github Copilot。
可能很多人会觉得这语言模型有必要捧那么高吗,不就是个聊天机器人吗?还经常犯一堆错。至少我个人认为,这还是非常具有颠覆性的。首先,一堆错这个问题,随着快速迭代肯定会基本解决掉的。其实这些大语言模型的出现,它是一个非常底层的变革,就是AI已经能生成自己的内容。这个其实就有点像互联网刚开始出现的时候,大家可能就会觉得现在可以在网上看新闻了,更方便了。可是谁能想到发展到后面,会有Facebook、淘宝、微信、直播带货等等这些应用,不光是商业价值很大而且确确实实也改变了人们的生活方式。
所以这个生成式AI,它最关键的,是产生了巨量的可能性。随便打个比方,没准以后就可能出现一个,你根据自己的数据训练出来的一个智能助手,它特别了解你的喜好、性格,还能24小时在线。你想,这是一个多大的市场。
当然,现在还处在一个非常早期的阶段,不过即使如此,你已经能看到这一波AI浪潮有非常大的商业价值。你说为什么像元宇宙、AR、VR这些一直都雷声大,雨点小的,它的可能性也很大,愿景聊得天花乱坠的,可是发展起来却没有那么顺利。这里边很主要的一个原因,就是它眼下的商业价值没有那么大。你看现在的VR,包括所谓的元宇宙,商业价值其实并不高,可生成式AI就不一样了。
你就看现在ChatGPT的这个火爆程度,估计Open AI可能自己也没想到,怎么突然就点爆市场了。它眼下就有巨大的商业利益,未来还有无限可能的这种商业机会。这就是为什么微软玩命催Open AI,就是GPT-4还没有完全调试好,就赶紧推出市场。各大厂商可能还非常非常早期,也被迫推出试用版,甚至一些连产品都还没有,也得宣布一下自己的布局。
李彦宏在发布会不就说了吗,为什么要现在这个时间点推?因为有市场需求,更关键的是,现在所有的资源,所有的人才,所有的算力,全都涌向了这个方向,这发展只会越来越快。
那它带来的风险到底有多大呢?
其实很多人在探讨甚至是害怕的就是AGI(通用人工智能)的出现。简单来说,就是可以全面超过人类,有自主意识的人工智能。那你说,有没有可能像电影里演的那种,就是人工智能反过来,跟人类产生敌对关系?
马斯克在2020年的时候又说过了,说人工智能可能在2025年之前超过人类。3月22日,微软甚至还发表了一篇长达155页的论文,标题就叫做《Chat GPT-4出现了,通用人工智能的早期征兆》。
而同样是在3月22日,一封警告人类不能无节制AI竞赛的公开信发表了出来,包括马斯克在内的各界人士联合签名。我这两天看,已经超过26000人签名了。这封公开信就呼吁各大公司暂停训练比GPT-4更强的AI至少6个月。
当然,我们心里都清楚,大家不可能因为这封公开信就停止这场AI竞赛。不管你是接受还是不接受,这波生成式AI的浪潮已经基本是不可逆的了。就我们整个的商业环境也很有可能在几年之内就发生天翻地覆的变化。
你是不是感觉这波AI浪潮已经有点可怕了?
其实我刚才举那两个,算是有点极端的例子。比如说微软那个论文,实际上我简单扫了一眼,大概意思就是说,这个GPT-4太厉害了,问题都答得太好了,好到甚至都有点AGI的意思了。
其实也有很多专家跳出来怼这篇论文,就说这也太扯了,你这就AGI了。而那封公开信,很多人其实也就去签个名。你说这种警告性质的东西,稍微有那么点危言耸听,也不是什么大问题。
那现在这个AI的风险到底有多大呢?咱之前不也聊过ChatGPT的底层逻辑吗?它说白了,其实还是玩词语接龙的一个游戏,就是根据前文去猜下一个词的最大概率。AI根本不知道它在说什么,它只是一个学习模仿能力都极极极强的鹦鹉。所以单就以ChatGPT为代表的这类技术来看,它现在还没有那么可怕。但是这个”现在”可能也保证不了几个月。
那如果这个鹦鹉可以几乎完美无缺地回答所有的问题,你怎么知道它不会逐渐形成自己的意识呢?当然我肯定不是这方面专家,其实我也挺好奇大家是怎么看的,就是你觉得类似ChatGPT这种,它到底能不能产生自主意识,甚至达到了这AGI呢?
至于很多人会担心这个AI到底会不会取代自己的工作。其实这个问题也确确实实存在。我觉得在未来的一段时间内,那些机械化、重复性、低技能的工作,确确实实会被AI取代掉。但是对于那些高技能、需要创造性思维和人际交往能力的工作,AI取代的可能性其实并不是那么高,所以我们也不需要过于恐慌。