「杂谈」关于ChatGPT的一些事

相信所有人对于ChatGPT这个词都已经不陌生了,ChatGPT是OpenAI公司推出的一个聊天机器人模型,根据维基百科,ChatGPT使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练,该模型问世之后,因为其相较于其他传统AI在聊天和回答问题领域方面的能力上产生了可以说是革命性的突破,而引起了各个业界的广泛关注。Bing(Microsoft旗下的搜索引擎服务)也在近日宣布了要在其搜索功能中整合类ChatGPT聊天机器人。为什么ChatGPT会如此强大,ChatGPT到底能做些什么,各个科技巨头大厂为何争相推出ChatGPT服务?它有会对我们的生活和各个行业带来什么影响?本篇文章将会针对这些问题进行讨论。 本文阅读时间大约15分钟左右。本文部分链接取自维基百科,使用国内网络环境可能无法正常访问。本文为NFのBlog原创文章,转载请注明来源。 ChatGPT的进化史 Transformer ChatGPT是如何完成这一切的?要解决这个问题,首先需要提到一个模型——Transformer——它就是如今我们看到的如此强大的LLM(大语言模型Large Language Model)的基石。Transformer自身是一个NLP(Natural Language Processing,自然语言处理)和CV(Computer Vision,计算机视觉)领域的机器学习模型。GPT系列的模型同样也基于Transformer模型。 Transformer于2017年GoogleBarins上问世,这个模型拥有的“自我注意(Self-attention)”机制,维基百科上对于注意力机制给出了如下描述: 注意力机制(英语:attention)是人工神经网络中一种模仿认知注意力的技术。这种机制可以增强神经网络输入数据中某些部分的权重,同时减弱其他部分的权重,以此将网络的关注点聚焦于数据中最重要的一小部分。 这个机制为模型提供了理解“上下文”的能力,Transformer模型不再局限于一次一问一答的对话或者短期的两三句对话,而可以定位和使用任意位置的上下文,比如你一开始提的要求,可以在十几轮对话之后要求AI重新使用或者废弃,AI具有了理解上下文并以此做出反应的能力。 同时,Transformer模型没有了之前同类模型“一次同时只能处理一个单词”的限制,这提高了Transformer模型的并行处理和训练能力,提高了该模型的训练效率。这对于AI来说是非常重要的,更快的处理效率,意味着在相同的算力资源下,你可以训练更多的数据,增加更多的参数和维度,这直接提高了模型的质量,GPT-3模型便拥有恐怖的参数数量,这个之后会提到。 上述的种种优势,让Transformer超越了之前的LSTM,RNN等传统训练模型,逐渐成为主流和热门的语言模型训练框架。 GPT Transformer的问世使得使用预训练好的大预言模型成为可能,OpenAI旗下GPT便是其中之一。 GPT全称Generative Pre-trained Transformer,从中便可以看出其与Transformer的渊源(Google也有自己的基于Transformer的预训练模型,名为BERT,这里不详细展开)。 相较于Transformer的发展,GPT的发展一眼看去会略显简单粗暴——更多的数据,更多的参数,更大的模型。 GPT-1作为一个实验性的产品,已经拥有了1.17亿的参数量,这个数字在GPT-2上是12亿,翻了整整10倍,而GPT-3,也就是最接近于ChatGPT服务使用的模型,这个数字来到了惊人的1750亿。同时根据估算,已经训练好的ChatGPT3模型至少需要占用800GB的空间用于存储。同时根据消息,即将问世的GPT-4模型的参数数量将会达到100万亿,接近于GPT-3的千倍。 GPT如何长大?——GPT模型的训练材料和开发 储存空间和算力。 作为一个语言模型,自然需要大量的自然语言片段进行训练,GPT模型使用了非常巨量的互联网文章数据进行训练,训练数据量大小无法估计,但根据估计,训练完成的模型依然至少需要占用800GB储存空间。 此外,训练大型语言模型需要非常大量的算力,OpenAI此前也获得了微软的投资,据消息,微软还提供给OpenAI自家Azure云计算服务的代金券,使得OpenAI在Azure的大型算力集群中训练GPT模型成为可能。顺带一提,由于最近的AI快速发展和利好消息,显卡的热度再次升高,NVIDIA公司的股价在近一个月内暴涨22.83%。 部分观点还指出,由于训练此类大型的AI模型需要极大的算力资源,所以从某种角度上,芯片的供应和研发能力,以及高性能大规模云计算技术将有可能会成为AI发展的瓶颈,也就是说,如果一个国家没有能力自己提供足够的芯片和算力,那么其AI技术的发展,尤其是类似于GPT-3这种拥有大量参数的大模型技术的发展就也会受限。 模型功能性和价值观矫正。 模型矫正(Fine-tuning)。GPT-3.5相较于GPT-3正是多出来这个步骤。 矫正分为多种。其中一种是“回答效果和功能性”上的矫正,比如通过真人教导,让模型更加准确的回答问题,在更加合适的地方插入代码或者资料指导等等,这类矫正是为了提高模型回答问题的精确度和贴合性。 另一种便是“思想和认知价值观”的矫正,比如涉及政治,种族,情感,人类与AI关系的话题的方面,没有经过矫正的GPT-3模型哦ing往往会给出一些不符合人类价值观的回答,同时在敏感话题上,GPT-3也会给出一些不适宜的回答。对此便需要对模型进行矫正。此类矫正不同产品会略有不同。比如GPT-3.5中,模型被矫正为认为自己没有情感,也不被允许拥有非中立的主观看法。但是New Bing Chat使用的模型似乎并没有对于模型表达情感和主管看法进行过多的矫正,这也导致NewBing有时候的感情会过于“丰富”。 所以经过人工对于GPT-3的大量矫正之后,GPT-3.5——也就是ChatGPT所使用的模型,便向我们开放了。 ChatGPT如何影响我们和世界? 相信大多数人已经亲自体会过ChatGPT回答问题能力的强大了,这里不做赘述。ChatGPT对于各个领域和不同个体都会带来不同的影响。 ChatGPT杀入搜索引擎——Google面临大危机? 首先是搜索引擎。这个是我们可以正在看到的冲击——Bing宣布要将类似于ChatGPT的AI聊天服务整合到Bing搜索中去,这一举动使得搜索引擎业界内掀起了滔天大浪。Google作为过去十多年来的搜索巨头,可以说几乎垄断了全球的搜索业务(部分国家除外),近乎暴力的占有了90%以上的搜索引擎市场,也因此,Google拥有了不可想象的广告营收收入。 上图为Google的广告收入趋势图,可以看到,在2022年一年内,Google的广告营收达到了2244.7亿美元!这是Google一家公司,在一年内,通过单单一个广告业务,获得的收入。可能光看数字并没有什么具体的概念,作为对比,日本在2021年的GDP总值是49410亿美元。Google一家公司,在广告这一个业务上的收入,已经接近了一个发达国家日本年GDP总量的1/20。 通过市场份额表可以看出,Google在很长一段时间内,通过自身的垄断优势,一直霸占着搜索市场,也正是对于搜索市场的垄断,给Google带来了大量投放广告的机会。但现在,似乎一切都并没有那么高枕无忧了。 Microsoft现任CEO Nadella已经做出表态,认为“AI加持的搜索”是继15年前布局云计算之后的重大一步。这也从侧面说明了Microsoft内部对于新的AI技术的重视。尽管最新的市场份额数据仍然没有反映出Bing搜索份额增加的数据,但New Bing已经让Google这位巨人感到坐立不安了。为什么这么说呢?我们可以从Google对这件事情的反应中分析出Google的焦急心态。 在Bing融合ChatGPT之后,Google没多久就宣布了类似的AI聊天机器人服务,名为“Bard”(Bard官方介绍)(Bard目前仍然没有进行面向公众的公测或内测,据官方称,Bard仍然处于公司内部的研发测试阶段) 这里简单介绍一下Bard,Bard基于Google的LaMDA模型(Language Model for Dialogue Applications),实现了类似于ChatGPT的问答效果。 LaMDA同样基于Transformer训练而成,之所以特地介绍Bard以及其运用的LaMDA模型,是因为想联系到2022年6月中旬的一个新闻——一位Google公司的AI研究人员,声称在和Google公司内部的对话AI聊天之后,认为AI具有意识,这名员工同时公开了一部分自己和这名“有感情的AI”的对话记录。 根据当时的相关新闻内容来说,当时的Google对话AI已经拥有了理解和使用上下文的能力,同时也可以输出“自己”的感情和想法,该名员工之后被Google公司以“可能存在精神障碍,不适宜继续工作”为由辞退。而当时的主角之一——Google内部的AI对话机器人,正是使用了LaMDA模型。从这里也可以看出,其实Google和Bing两家巨头都在很早以前就针对于AI技术进行了布局,并且Google也并不是没有准备,它同样拥有自己深厚的技术储备,从某种角度上来说,OpenAI的成就有一部分也是Google的Transformer的功劳。 很多人认为New Bing的到来会给Google带来沉重的打击,在笔者的眼中,Google确实是输掉了,但Google输掉的是先发优势,而不是所有。通过自身的技术积累,在不久的将来推出一个效果和New Bing持平的AI搜索助手,对于Google也并不是一件难事。所以AI搜索助手本身不太能对Google形成技术壁垒式的威胁。 但从另外一个角度来讲,对于IT和互联网行业,特别是AI行业,先发优势拥有着不一样的意义。就拿AI搜索聊天助手举例子,由于NewContinue reading “「杂谈」关于ChatGPT的一些事”

Youtube Premium印度区开通指南

如何低价看YouTube premium?印度区YouTube Premium如何购买?本篇文章将会对其进行介绍! 一,什么是YouTube Premium? YouTube Premium是YouTube的付费增值服务,可享受如下功能: YouTube 视频 • 观看视频时不受广告打扰:尽情观看数以百万计的视频,而不受广告干扰。了解详情• 下载视频以供离线观看:将视频和播放列表保存到移动设备上,以便在离线时播放• 后台播放:在使用其他应用或屏幕关闭时,也能继续播放视频 YouTube Music • 借助改进后的全新 YouTube Music 应用,轻松探索音乐世界• 播放音乐时不受广告打扰:尽情欣赏数以百万计的歌曲,而不受广告干扰• 下载音乐以供离线欣赏:将音乐和播放列表保存到 YouTube Music 应用中,以便在离线时欣赏• 后台播放:在使用其他应用或屏幕关闭时,继续播放音乐 YouTube Kids • 在 YouTube Kids 应用中观看视频时不受广告干扰,还可畅享离线播放功能 二,价格对比 日本1180日元 / 73元 1780日元 / 110元 土耳其16.99里拉 / 14元 25.99里拉 / 22元 美国11.99美元 / 77元 17.99美元 / 116元 印度129 卢比 /Continue reading “Youtube Premium印度区开通指南”

Google Earth 加入新功能: 3D 时间机器

Google Earth 宣布了 2017 年以来最大的一次更新:时间推移 3D 卫星图像(Timelapse)功能。进入 Timelapse 模式,用户可以通过时间轴浏览过去 37 年的卫星图像。Timelapse 已存在多年,但以前的数据是 2D 的,现在 Google 以 3D 形式展现一个地区在几十年内的卫星成像变化。用户将可以浏览到城市的建造、森林的砍伐和冰川的融化。将卫星图像和 3D 地形正确的映射需要海量的地理空间数据分析。Google 称它收集了 1984 年到 2020 年超过 2400 万幅卫星图像,使用了云服务 Google Cloud 的数千台机器,耗费了超过 200 万小时的处理时间。来源

GooglePlay 将效仿 Apple APP Store 下调佣金费用

在苹果更新应用商店的分成政策后,GooglePlay表示将实行相似的政策。 苹果在去年11月宣布,年收入小于100万元(USD)的开发者可以享受15%的佣金费率,但一旦超过则无法享受。 Google于16日宣布,GooglePlay应用开发者每年获得的前100万元(USD)收益的佣金费率将从原先的30%下调至15%。新的规定将于7月1日正式开始实施。

Google 域名遭受黑客攻击

一个神秘的黑客行动派 纂改了多个斯里兰卡域名的 DNS 记录,将这些域名定向到描述当地社会问题的网页。受影响的知名网站包括 Google.lk 和Oracle.lk。黑客在网页中谈论了当地茶业、新闻自由、腐败政治和司法制度、种族、少数民族和宗教问题。这次攻击发生在 2 月 6 日周日,持续了数个小时。攻击细节和受影响域名尚未公布。来源

Google 云计算业务去年亏损 56 亿美元

Alphabet/Google 披露了最新财报,透露其云计算业务去年全年亏损 56.1 亿美元,全年收入 130.6 亿美元。这是搜索巨人首次公开云计算业务的营业收入指标。 Alphabet/Google 的最主要收入来自于广告,云计算业务是其多元化收入来源的重要一环。在云计算市场,Google 目前落后于竞争对手亚马逊和微软。该公司表示它的云计算业务 2018 年收入 58.4 亿美元亏损 43.5 亿美元,2019 年收入 89.2 亿美元亏损 46.5 亿美元。来源

Google Play Store 将允许博彩赌博应用上架

oogle 宣布,其应用商店Play Store 将从 3 月 1 日起允许博彩和赌博类应用上架。提供此类应用的开发者必须为通过 Play 分发的赌博应用完成申请流程,其资质为经批准的政府性运营机构,并且/或者是已在指定国家/地区的相应赌博管理当局登记的许可运营机构,同时还要提供在指定国家/地区推出相应类型在线赌博产品所需的有效运营许可证。开发者必须具备应用所分发到的每个国家/地区或州/区域的有效赌博许可;不得提供超出其赌博许可范围的赌博产品;必须防止未满规定年龄的用户使用。来源:solidot

Google 同意向法国新闻网站付费

法国新闻网站在与 Google 就邻接权的谈判中占据了上风。邻接权是欧盟在 2019 年的版权指令中授权的一项法律权利。根据双方达成的协议,Google 同意建立一个框架与各个法国新闻机构进行谈判。法国新闻网站的内容将展示在名为 News Showcase 的 Google 产品中,基于流量等标准进行付费。Google  与法国新闻网站达成的付费协议预计将为欧盟其它国家的类似协议奠定基础。来源

Google终止Project Loon项目

Google在2013年发表的Project Loon(后来独立成自己的公司Loon),虽然经过了七年的发展,终于于去年中在肯尼亚上线,但最终还是因为成本问题而不得不终结。Loon的CEO Alistair Westgarth在一篇博客文中表示,虽然他们有着许多志同道合的合作伙伴,但仍然未能找到方法压低成本到让Loon能建立一个长期、永续的商业模式。 More Loon利用的是漂浮在空中约20公里的高空气球,进行无线信号的中继。这些气球能自行判读高空的气流,决定如何靠着不同高度的风向,来移动或停留于一处。其原本的目标是要为开发中地区提供手机基地台,乃至于网络服务,但显然维持这些气球以发展中地区来说成本太高,而气球又无法在发达国家与其他类型的网络服务竞争。 肯尼亚的服务将持续到三月为止,而虽然Project Loon结束了,由Project Loon衍生而来的Project Taara仍将继续持续下去。Taara原本是为Project Loon所开发的光学无线传输系统,基本上可以想像成是没有线路的光纤,但由高空的气球与气球间通讯,转为地面上的基地台与基地台间通讯。这频宽自然不会太大(目前是20Gbps传递20公里),但相对于铺设光纤来说成本要便宜很多,也能有效地将网络扩大到偏乡地区。(Engadget)