相信所有人对于ChatGPT这个词都已经不陌生了,ChatGPT是OpenAI公司推出的一个聊天机器人模型,根据维基百科,ChatGPT使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练,该模型问世之后,因为其相较于其他传统AI在聊天和回答问题领域方面的能力上产生了可以说是革命性的突破,而引起了各个业界的广泛关注。Bing(Microsoft旗下的搜索引擎服务)也在近日宣布了要在其搜索功能中整合类ChatGPT聊天机器人。为什么ChatGPT会如此强大,ChatGPT到底能做些什么,各个科技巨头大厂为何争相推出ChatGPT服务?它有会对我们的生活和各个行业带来什么影响?本篇文章将会针对这些问题进行讨论。
本文阅读时间大约15分钟左右。本文部分链接取自维基百科,使用国内网络环境可能无法正常访问。本文为NFのBlog原创文章,转载请注明来源。
文章目录
ChatGPT的进化史
Transformer
ChatGPT是如何完成这一切的?要解决这个问题,首先需要提到一个模型——Transformer——它就是如今我们看到的如此强大的LLM(大语言模型Large Language Model)的基石。Transformer自身是一个NLP(Natural Language Processing,自然语言处理)和CV(Computer Vision,计算机视觉)领域的机器学习模型。GPT系列的模型同样也基于Transformer模型。
Transformer于2017年GoogleBarins上问世,这个模型拥有的“自我注意(Self-attention)”机制,维基百科上对于注意力机制给出了如下描述:
注意力机制(英语:attention)是人工神经网络中一种模仿认知注意力的技术。这种机制可以增强神经网络输入数据中某些部分的权重,同时减弱其他部分的权重,以此将网络的关注点聚焦于数据中最重要的一小部分。
这个机制为模型提供了理解“上下文”的能力,Transformer模型不再局限于一次一问一答的对话或者短期的两三句对话,而可以定位和使用任意位置的上下文,比如你一开始提的要求,可以在十几轮对话之后要求AI重新使用或者废弃,AI具有了理解上下文并以此做出反应的能力。
同时,Transformer模型没有了之前同类模型“一次同时只能处理一个单词”的限制,这提高了Transformer模型的并行处理和训练能力,提高了该模型的训练效率。这对于AI来说是非常重要的,更快的处理效率,意味着在相同的算力资源下,你可以训练更多的数据,增加更多的参数和维度,这直接提高了模型的质量,GPT-3模型便拥有恐怖的参数数量,这个之后会提到。
上述的种种优势,让Transformer超越了之前的LSTM,RNN等传统训练模型,逐渐成为主流和热门的语言模型训练框架。
GPT
Transformer的问世使得使用预训练好的大预言模型成为可能,OpenAI旗下GPT便是其中之一。
GPT全称Generative Pre-trained Transformer,从中便可以看出其与Transformer的渊源(Google也有自己的基于Transformer的预训练模型,名为BERT,这里不详细展开)。
相较于Transformer的发展,GPT的发展一眼看去会略显简单粗暴——更多的数据,更多的参数,更大的模型。
GPT-1作为一个实验性的产品,已经拥有了1.17亿的参数量,这个数字在GPT-2上是12亿,翻了整整10倍,而GPT-3,也就是最接近于ChatGPT服务使用的模型,这个数字来到了惊人的1750亿。同时根据估算,已经训练好的ChatGPT3模型至少需要占用800GB的空间用于存储。同时根据消息,即将问世的GPT-4模型的参数数量将会达到100万亿,接近于GPT-3的千倍。
GPT如何长大?——GPT模型的训练材料和开发
储存空间和算力。
作为一个语言模型,自然需要大量的自然语言片段进行训练,GPT模型使用了非常巨量的互联网文章数据进行训练,训练数据量大小无法估计,但根据估计,训练完成的模型依然至少需要占用800GB储存空间。
此外,训练大型语言模型需要非常大量的算力,OpenAI此前也获得了微软的投资,据消息,微软还提供给OpenAI自家Azure云计算服务的代金券,使得OpenAI在Azure的大型算力集群中训练GPT模型成为可能。顺带一提,由于最近的AI快速发展和利好消息,显卡的热度再次升高,NVIDIA公司的股价在近一个月内暴涨22.83%。
部分观点还指出,由于训练此类大型的AI模型需要极大的算力资源,所以从某种角度上,芯片的供应和研发能力,以及高性能大规模云计算技术将有可能会成为AI发展的瓶颈,也就是说,如果一个国家没有能力自己提供足够的芯片和算力,那么其AI技术的发展,尤其是类似于GPT-3这种拥有大量参数的大模型技术的发展就也会受限。
模型功能性和价值观矫正。
模型矫正(Fine-tuning)。GPT-3.5相较于GPT-3正是多出来这个步骤。
矫正分为多种。其中一种是“回答效果和功能性”上的矫正,比如通过真人教导,让模型更加准确的回答问题,在更加合适的地方插入代码或者资料指导等等,这类矫正是为了提高模型回答问题的精确度和贴合性。
另一种便是“思想和认知价值观”的矫正,比如涉及政治,种族,情感,人类与AI关系的话题的方面,没有经过矫正的GPT-3模型哦ing往往会给出一些不符合人类价值观的回答,同时在敏感话题上,GPT-3也会给出一些不适宜的回答。对此便需要对模型进行矫正。此类矫正不同产品会略有不同。比如GPT-3.5中,模型被矫正为认为自己没有情感,也不被允许拥有非中立的主观看法。但是New Bing Chat使用的模型似乎并没有对于模型表达情感和主管看法进行过多的矫正,这也导致NewBing有时候的感情会过于“丰富”。
所以经过人工对于GPT-3的大量矫正之后,GPT-3.5——也就是ChatGPT所使用的模型,便向我们开放了。
ChatGPT如何影响我们和世界?
相信大多数人已经亲自体会过ChatGPT回答问题能力的强大了,这里不做赘述。ChatGPT对于各个领域和不同个体都会带来不同的影响。
ChatGPT杀入搜索引擎——Google面临大危机?
首先是搜索引擎。这个是我们可以正在看到的冲击——Bing宣布要将类似于ChatGPT的AI聊天服务整合到Bing搜索中去,这一举动使得搜索引擎业界内掀起了滔天大浪。Google作为过去十多年来的搜索巨头,可以说几乎垄断了全球的搜索业务(部分国家除外),近乎暴力的占有了90%以上的搜索引擎市场,也因此,Google拥有了不可想象的广告营收收入。
上图为Google的广告收入趋势图,可以看到,在2022年一年内,Google的广告营收达到了2244.7亿美元!这是Google一家公司,在一年内,通过单单一个广告业务,获得的收入。可能光看数字并没有什么具体的概念,作为对比,日本在2021年的GDP总值是49410亿美元。Google一家公司,在广告这一个业务上的收入,已经接近了一个发达国家日本年GDP总量的1/20。
通过市场份额表可以看出,Google在很长一段时间内,通过自身的垄断优势,一直霸占着搜索市场,也正是对于搜索市场的垄断,给Google带来了大量投放广告的机会。但现在,似乎一切都并没有那么高枕无忧了。
Microsoft现任CEO Nadella已经做出表态,认为“AI加持的搜索”是继15年前布局云计算之后的重大一步。这也从侧面说明了Microsoft内部对于新的AI技术的重视。尽管最新的市场份额数据仍然没有反映出Bing搜索份额增加的数据,但New Bing已经让Google这位巨人感到坐立不安了。为什么这么说呢?我们可以从Google对这件事情的反应中分析出Google的焦急心态。
在Bing融合ChatGPT之后,Google没多久就宣布了类似的AI聊天机器人服务,名为“Bard”(Bard官方介绍)(Bard目前仍然没有进行面向公众的公测或内测,据官方称,Bard仍然处于公司内部的研发测试阶段)
这里简单介绍一下Bard,Bard基于Google的LaMDA模型(Language Model for Dialogue Applications),实现了类似于ChatGPT的问答效果。
LaMDA同样基于Transformer训练而成,之所以特地介绍Bard以及其运用的LaMDA模型,是因为想联系到2022年6月中旬的一个新闻——一位Google公司的AI研究人员,声称在和Google公司内部的对话AI聊天之后,认为AI具有意识,这名员工同时公开了一部分自己和这名“有感情的AI”的对话记录。
根据当时的相关新闻内容来说,当时的Google对话AI已经拥有了理解和使用上下文的能力,同时也可以输出“自己”的感情和想法,该名员工之后被Google公司以“可能存在精神障碍,不适宜继续工作”为由辞退。而当时的主角之一——Google内部的AI对话机器人,正是使用了LaMDA模型。从这里也可以看出,其实Google和Bing两家巨头都在很早以前就针对于AI技术进行了布局,并且Google也并不是没有准备,它同样拥有自己深厚的技术储备,从某种角度上来说,OpenAI的成就有一部分也是Google的Transformer的功劳。
很多人认为New Bing的到来会给Google带来沉重的打击,在笔者的眼中,Google确实是输掉了,但Google输掉的是先发优势,而不是所有。通过自身的技术积累,在不久的将来推出一个效果和New Bing持平的AI搜索助手,对于Google也并不是一件难事。所以AI搜索助手本身不太能对Google形成技术壁垒式的威胁。
但从另外一个角度来讲,对于IT和互联网行业,特别是AI行业,先发优势拥有着不一样的意义。就拿AI搜索聊天助手举例子,由于New Bing率先发布其AI搜索助手,获得先发优势,所以大量的尝鲜用户涌入Bing,使用其AI产品,而这进一步为New Bing的AI提供了真实而宝贵的训练资料(AI的效果很大程度上取决于训练资料的质量,而如此大量的真人对话语料是十分宝贵的),而New Bing通过这些资料进一步训练和校准之后,将会获得更好的效果,而更好的效果又会吸引更多用户使用Bing,这是一个典型的正反馈情景,占有优势者反而会获得更多资源和用户,不断加深其优势,最终形成不可逾越的壁垒。这是一个Winner-takes-all的局面。
因此,Google不能过久的放任New Bing的发展,选择了加紧工期研制同类竞品Bard,同时不断为此造势。但正是因为Google失去了先发优势,导致入场和获得认可的难度相对于New Bing要大很多。举个例子,ChatGPT和New Bing在搜索的时候难免会出现数据错误的情况,这本身也是目前AI技术的限制和瓶颈,你不可能保证AI的回答每次都是正确的,人们自然知道这一点,所以ChatGPT和New Bing仍然成为舆论关注的焦点。
在炒热度方面,Bard也做到了,不过这次它用了另一种方式——它出错了。这一次,它不是在某个用户使用它的时候出错(毕竟Bard至今仍然没有开放给公众使用),Bard在自己的首次公开的Demo宣传片中出现了事实性错误——Bard回答James Webb太空望远镜拍下了第一张太阳系外行星的照片。并不是,第一张系外行星的照片是由VLT在2004年拍摄的,这次事件也导致了Google的股票价格当天应声大跌将近10%。
为什么ChatGPT和Bing犯错没有产生这么大的反应,而Google的一个事实性错误直接导致了千亿市值蒸发?我个人认为主要有两点,第一,Google失去了先发优势,人们已经领略到了ChatGPT的厉害,Google没有了带给用户新鲜感和冲击的机会,反之,用户会认为Google的Bard本就应该达到类似于ChatGPT和New Bing的水平,甚至用户会对Bard拥有着更严格的要求——不然用户没有抛弃已经使用了一段时间的ChatGPT和New Bing而重新选择Bard的理由——如果你是中场入场,那么你想抢占市场份额,就必须比目前在场的所有人都做的更好。第二,错误出现在宣传片中。这个错误出现在Bard的首支公开宣传片中。用户使用的时候出现错误,是无可厚非的,毕竟AI目前无法做到不出错。但问题是,错误出现在了一个科技巨头公司的新产品宣传片中——宣传片,作为产品的主要宣发途径(本例中甚至还是首次宣发),理论上公司应该精心准备才对,宣传片发布前也应该经过各种审核流程,确保没有错误或者不适宜的内容。但事实是,Google似乎并没有怎么对宣传片进行审核。这不但透露出Bard的准确性并不高,同时还侧面映射出了Google内部的焦急状态,Google实在是太想尽快退出Bard了,这正说明了Google已经把AI加持的New Bing看成了重大威胁,不然没有必要如此急急忙忙,甚至破坏严格的宣发审核流程直接发布宣传片。
总之,Google和Bing的故事才刚刚开始,搜索引擎的未来如何发展,值得我们拭目以待。
顺带一提,Baidu也宣布了自己的类似竞品“文心一言”,据相关信息声称,该模型已经进入最后的冲刺阶段,预计在3月份上线。同时,复旦团队也发布了国内首个类ChatGPT项目“MOSS”并已经开始内测,但截至撰稿时貌似已经停止服务。
ChatGPT“入侵”各个行业——人类会被取代?
ChatGPT自从问世以来,强大的回答能力便不断引起人们的担忧——ChatGPT都能做得这么好,我的工作貌似也已经可以被它取代了。ChatGPT技术的发展是否会对各个行业造成冲击和影响?又是否会导致失业危机?
先来看几则新闻:
事实证明,ChatGPT在“通过考试”方面似乎有着自己的天赋,接连通过了美国法律学校,商务学校的考试,此外,ChatGPT也被证实可以通过Google公司的L3级工程师的面试。此外相信各位也已经看到过很多令人震撼的ChatGPT回答专业问题的例子,在回答专业问题上,ChatGPT还是挺专业的。
比如编程领域,ChatGPT就表现的令人惊喜——它可以根据你的描述生成你需要的代码,你也可以将报错的代码发送给它,让它帮你分析这段代码存在什么问题。
事实上,已经有人正在利用ChatGPT的代码能力辅助自己工作了,比如——Amazon的员工。但有趣的是,Amazon在了解情况之后,马上发布通知,禁止自己公司的员工使用ChatGPT,官方称是出于“内部数据安全”考虑。有相关信息表示,Amazon发现,ChatGPT给出的部分针对于特定问题的回答,已经非常接近于公司内部的代码和解决方案,这引起了公司对于数据安全性的担忧。
以上种种例子,都比较清晰的表明出,ChatGPT已经具有了相当的能力,以至于让ChatGPT取代部分以往由人类完成的工作成为可能。其实如果了解和关注AI相关新闻的读者不难发现,类似的“AI取代/击败人类”的情况并不是第一次发生了。Alpha围棋AI击败人类围棋实力的顶峰——世界冠军柯洁,这个例子已经比较久远了,并且貌似不是很贴切,那NovelAI呢?22年年末,NovelAI的发布,就像是绘画界的New Bing一般,给人类画师带来了大大的AI震撼,24小时无间断不用休息,通电就能画画,通过自然语言生成高质量的图片,甚至可以针对于不同的画风和角色针对性的训练模型,NovelAI凭借“一己之力”,让千万底层画师整夜无眠。如今,ChatGPT把这个焦虑播撒到了各个领域——客服?老师?工程师?程序员?律师?ChatGPT涵盖了前所未有的广度,同时也带来了前所未有的困扰和担忧。
就个人看法,我认为,AI技术的发展和扩张是不可避免的,同时也是值得鼓励的。AI作为一项新的技术,人类想要了解,学习,探索,发展,是符合发展规律的,新的工具也必然会给人类带来以往所没有的便捷。任何事务都会存在两面性,AI技术也是如此,我们需要不断推进AI模型的发展,使得AI更加强大,但同时我们也需要做好对于AI负面影响的控制和处理,同时学会利用AI技术。我们的思路不能局限于“被AI取代”,没有必要时刻将自己和AI放在对立面,反之,应该思考“如何利用AI改进和辅助我目前的工作流”。举个例子,比如对于程序员来说,与其担心自己是否有一天会被ChatGPT所取代,还不如开始学习ChatGPT的使用,在工作中熟练的使用ChatGPT加快自己的代码调试速度和开发速度。就如某篇新闻稿的标题一般:“ChatGPT通过了Google年薪20万的工作,你可以拿到更多”,俗话说得好:多一个朋友,就少一个敌人,不妨尝试和ChatGPT交个朋友,也许你会有意想不到的收获呢?
AI优越性——于个人,于集体,于国家
ChatGPT再次证明了AI技术的前沿性和突破性,也展示出AI前所未有的潜力,同时,就如芯片制造一般,AI是一项高技术密度的产业,同时AI也拥有着非常高的技术应用场景,这也导致了AI优越性和AI技术的垄断局面是有可能出现的,这种优越性在各种层面都有可能会出现,这种优越性也有可能会随着AI的发展越来越明显,以下是我个人的一些看法。
对于个人和集体来说,AI优越性主要体现在对AI技术的使用能力上。就如上一小节中提到的,有一部分人会主动了解和学习AI技术,并且尝试将AI技术的应用在自己的工作流上,而这些人通过AI提高了工作效率,而这类人在了解和使用AI获得收益之后,会更加愿意和主动的学习各种新的AI技术。反之,在未来,不能熟练使用AI可能会导致自身的竞争力不如那些熟练使用AI的人,从而处于劣势。这也更说明了,作为个人,我们应该对于AI持开放包容的态度,甚至应该主动了解和学习一些AI技术的相关实践和使用,无论身处什么位置,哪个行业,使用AI的能力都有可能在未来成为一种优势。作为集体也同理,能够在内部合理使用AI技术的集体,相对于不能或者不会使用AI技术的集体,将更有可能取得更好的发展。这里强调“合理”,是因为并不是所有的使用场景都是有利的,一个例子,部分国家的学生通过ChatGPT完成自己的论文,这就不像是“合理”的使用场景。而对于学校,如果能将ChatGPT应用到一些教学演示,学生答疑,和帮助老师和学生扩展对于课程和知识的思考的相关领域,我相信一定能够带来一些令人眼前一亮的效果。比如可以用ChatGPT来解决一些初学学生对于课程和作业的问题,这恰好是ChatGPT擅长的专业性领域。
对于企业来说,AI优越性会带来极大的商业优势。这点想必无需多做解释,上面提到的Google和Bing的战争已经很好的展示了AI技术融入产品之后带来的革新,以及其对企业,尤其是科技企业带来的影响。对于企业来说,跟紧时代的步伐显得尤为重要。我们可以浅浅拿雅虎公司来做个例子。
顶峰时期估值一度达到1250亿美元的雅虎公司,最后却落得被4.8亿美元完成收购的结局。
故事从1995年说起,那时的雅虎正处于它的“猛兽时期”,当时的雅虎拥有着非常高用户量的网址导航服务,通过将搜索功能集成到其网址导航服务中,Yahoo Search(雅虎搜索)也成功斩获大批用户,雅虎在网址导航中加入了雅虎新闻,雅虎邮箱等等各种服务,它也成功打败了同期的同类型产品——AOL和MSN,的成为了大多数网民访问互联网的第一站。可以说,在两千年前后,雅虎的地位就好比现在的Google一样,几乎不可撼动。
说来也有趣,在1998年,Google也曾今联系过雅虎,表示希望以100万美元的价格将Google公司包括其排名算法售卖给雅虎。不用说也知道,雅虎看着一个连网页都还没有,只有pagerank算法的无名小公司,没怎么犹豫便拒绝了这个“亏本生意”。
但事情逐渐朝着预期外发展。人们逐渐发现,网址导航已经逐渐不能在“一站式”的满足所有上网需求了,相比于在固定的网址导航内搜索信息,得益于Google积累下来的优秀的搜索结果排名算法,人们发现通过一个名为“Google”的搜索引擎进行搜索,可以更加灵活,更加方便的看到自己真正想要的相关信息。此时,互联网的大局已经开始发生不可逆的改变,在2004年4月,Google就已经一跃变成了月活量排名第三的网站。雅虎这时才如梦初醒般的反应过来,试图再次联系Google,以30亿美元的价格收购Google,Google表示:你给的太少了,哄小孩玩呢?最少得50亿。
最后的结果大家也已经知道了,雅虎没有同意调皮小屁孩Google的讨价还价,而Google凭借着在搜索结果中展示广告获得了难以想象的巨额收益(上面也提到了,这种收益模式帮助Google一步一步走到了现在的位置),Google搜索也成功从2002年30%左右的市场份额逐渐发展到2008年近的80%。
雅虎输了。输在了没有认识到搜索引擎技术这一技术将给互联网带来的冲击。
所以Google和Bing这些现在的科技巨头也在害怕,自己会因为AI技术的落后成为下一个雅虎。这也是为什么微软甚至愿意在几年前就投资10个亿给一个名为“OpenAI”的无名小公司去研究一个不一定成功的AI产品,而Google也早在2014年AI都还没冒头的时候就花6亿美元买下了一个当时没什么名气的AI初创公司DeepMind,同时花费大量预算研究Transformer,LaMDA。假设Bing没有融合ChatGPT,这几年AI也并没有兴起,Google顶多算是亏掉了6亿经费,但倘若六七年前的Google没有布局AI领域呢,现在的Google,面对AI技术加持的New Bing将会输掉什么?谁也不知道,也许是赖以生存的搜索业务,等到那时,Google大概就是下一个雅虎了。
对于国家来说,AI的优越性更加值得关注,甚至有一定的可能演变成AI霸权。AI技术在将来,很有可能成为国家科技实力的一大方面。上面也提到过,AI领域大多数情况下都会遵循一种正反馈的Winner-takes-all的局势——也就是抢占先机的一方会进一步扩大优势,逐渐形成壁垒。一旦某个国家掌握绝大多数AI技术和模型,进入快速迭代的正反馈周期,第三者在想入场,将会显得十分困难。同时AI霸权国家也可以随心所欲限制其他国家,团体和个人对于AI模型的使用,起到压制别国的AI技术发展的效果。虽然目前来说,AI技术是否会在未来成为高科技工业和发展的重要基础还不能确定,但就目前的情况判断,AI拥有的潜力是无法想象的,5年前,绝大部分的人认为“艺术”领域是AI绝不可能涉足的禁地,那时估计也没有人想到,5年后自己将会无法再轻易的分辨出人类画师和AI模型的作品。
写在最后
总而言之,AI作为一项近几年不断兴起的技术,已经不断的进入我们的生活中,可以说,AI的每一次入场都是令人震撼的, Github Copilot的入场震惊了业界众多的程序员,将编程体验抬升到了前所未有的新高度,上方所讲的NovelAI也在AI绘画界掀起大浪,如今,ChatGPT的问世也成功引起了全世界的关注,AI的发展如此迅速,使得我们产生了前所未有的焦虑和恐惧,我们开始害怕AI给人类社会带来的冲击,所以部分人开始怀疑和拒绝AI技术,认为类似于ChatGPT之类的技术应该被严格限制,尝试通过将此类AI技术拒之门外来保证人类的安全。
我们固然不能忽视AI技术对人类社会的风险和挑战,作为一项尚未成熟和广泛应用的新技术,ChatGPT和其他AI技术应该受到持续地关注和研究,我们也应该及时发现和解决AI技术应用之后带来潜在的问题和风险,同时,我们也应该在保证人类安全的前提下,积极地拥抱AI技术,充分发挥出AI本该拥有的才能,尝试将其应用于更多的领域,为人类社会带来更多的创新和进步。
数据来源与内容应用
Google Bard Introduction: https://blog.google/technology/ai/bard-google-ai-search-updates/
Search Market Share in worldwide (Desktop): https://www.statista.com/statistics/216573/worldwide-market-share-of-search-engines/
Blake Lemoine: Google fires engineer who said AI tech has feelings: https://www.bbc.com/news/technology-62275326
Is LaMDA Sentient? — an Interview: https://cajundiscordian.medium.com/is-lamda-sentient-an-interview-ea64d916d917
2M1207 b - First image of an exoplanet: https://exoplanets.nasa.gov/resources/300/2m1207-b-first-image-of-an-exoplanet/
百度创始人:文心一言将引领搜索体验代际变革: https://www.zaobao.com.sg/realtime/china/story20230223-1366043
ChatGPT passes exams from law and business schools: https://edition.cnn.com/2023/01/26/tech/chatgpt-passes-exams/index.html
Microsoft vs Google: AI War Explained | tech news: https://www.youtube.com/watch?v=BdHaeczStRA
Wikipedia: Yahoo!: https://en.wikipedia.org/wiki/Yahoo!
文章评论(2)
程序员都要被AI取代了以后(悲
@NF 写的挺详细的