近日,非营利人工智能研究组织OpenAI 推出了AI聊天机器人ChatGPT,它可以跟用户聊天,也能回答一系列问题,并在不到一周的时间里拥有超过100 万名使用者。由于该模型仍处于研究预览阶段,因此开放用户免费试用,但不会永久开放免费使用。

那么,这个火爆全网的ChatGPT 到底是什么呢它是如何运作的作为能够智能对话的模型,它能够取代Google吗

ChatGPT 的推出和爆火,用户破百万

11 月30 日,非营利人工智能研究组织OpenAI 宣布推出新型聊天机器人模型ChatGPT ,得到了很多用户的欢迎。由于该模型目前为研究预览阶段,因此开放用户免费试用。目前,用户只需进行注册,就可开始与ChatGPT 免费互动,ChatGPT 甚至还支持中文等多国语言。

据彭博报导,ChatGPT 在开放试用后,在网络上掀起一场热潮,从回答历史争议、到为加密货币赋诗,用户们在推特分享ChatGPT 提供的详细解答,并对此感到惊讶,一名试用者就分享测试心得直言,ChatGPT 能轻易完成1000 字的大学回家作业论述文。

此外,OpenAI 执行长Sam Altman 在5 日发推披露,在ChatGPT 上周三推出之后,迄今已有超过100 万名使用者。

据瑞银集团的一份报告显示,在ChatGPT 推出仅两个月后,它在2023 年1 月末的月活跃用户已经突破了1 亿,成为史上用户增长速度最快的消费级应用程式。值得注意的是,TikTok 达到1 亿用户用了9 个月,Instagram 则花了2 年半的时间。

ChatGPT 是什么它特别在哪里

那么,这么好用的机器人ChatGPT 到底是什么为什么会一夜间红遍网络呢

在了解ChatGPT 是什么前,我们首先需要简单了解一下它的公司。

1、OpenAI 公司介绍

OpenAI总部位于旧金山,由特斯拉执行长马斯克、Sam Altman 及其他投资者在7 年前共同创立,目标是开发「造福全人类」的人工智慧技术,但马斯克在2018 年时因针对公司发展方向存在分歧而离去。

此前, OpenAI因推出GPT-3 自然语言处理模型而闻名于世,该模型允许AI 对文本做出智能反应。而目前推出的ChatGPT 或将是OpenAI 的GPT-4 正式推出之前的序章。

2、ChatGPT 聊天机器人介绍

ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的输入,产生相应的回应。通过学习大量现成文本,ChatGPT 能够模拟人类的对话方式,在自然语言理解和生成方面有显著进步。

用户在注册ChatGPT 后,可以要求ChatGPT 回答问题,例如:「谁是1955年的美国总统」、「生命的意义是什么」、「如果今天外面有摄氏4.4度,我应该穿什么」等问题。对于穿着,ChatGPT 回答,穿着取决于你的活动,如果你要外出,你可以穿薄外套或毛衣、长裤和不露脚趾的鞋子,如果你想在室内,就穿T恤、牛仔裤或其他舒适的衣服。

比起传统文字生成AI 领域仅来自资料库的规律资料,弱点诸如简单识别并预测给定文字串内容(鹦鹉学舌)、资料库过时等等。ChatGPT 改编自OpenAI 的GPT-3.5 模型,除了对答流畅,还能记住使用者先前的对话内容,表现更为人性,对2021 年之后发生的事有一定了解,可说是目前为止最懂得沟通的AI,以更人性化的方式处理用户的自然语言。

不过,ChatGPT 拒绝回答许多可能有害的问题(例如与仇恨言论,暴力内容或如何制造炸弹等主题相关),因为这些答案将违背其「程式设计和目的」。OpenAI 通过预置所有输入的特殊提示以及使用一种称为「从人类反馈中强化学习」(RLHF)的技术来实现这一点,该技术可以根据人类对其生成的回应进行评分来微调AI 模型。

此外,除了对话外,各国网友正在尝试寻找ChatGPT 的潜在用途,例如ChatGPT 可以写诗、用详细的例子纠正编码错误、编写新代码、阐述热狗作为三明治的哲学。

3、ChatGPT 官方APP 正式上线

ChatGPT 推出后便大受欢迎,但另不少人感到遗憾的是,ChatGPT 没有手机版本,只能在网页上使用,或使用接入GPT-3 / GPT3.5 的第三方 app。

2023 年5 月19 日,官方ChatGPT 手机版本正式上线,而且提供GPT-3.5 和目前最新、最强大的GPT-4 模型选择,让使用者可以跟AI 尽情对话。

ChatGPT APP 将是免费使用的,最初只开放美国以及特定市场,现在已推送至152 个国家。根据OpenAI的说法,推出iOS App是他们将最先进的研究成果转化成一款实用工具的第一步,未来也会不断降低使用门槛。

GPT-3 模型是什么

实际上,GPT-3 就是一个简单的统计语言模型。从机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度(例如衡量人机对话系统自动产生的回复是否自然流畅),同时也可以用来预测生成新的句子。例如,对于一个片段「中午12 点了,我们一起去餐厅」,语言模型可以预测「餐厅」后面可能出现的词语。一般的语言模型会预测下一个词语是「吃饭」,强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语「吃午饭」。

通常,一个语言模型是否强大主要取决于两点:首先看该模型是否能够利用所有的历史上下文信息,上述例子中如果无法捕捉「中午12 点」这个远距离的语义信息,语言模型几乎无法预测下一个词语「吃午饭」。其次,还要看是否有足够丰富的历史上下文可供模型学习,也就是说训练语料是否足够丰富。由于语言模型属于自监督学习,优化目标是最大化所见文本的语言模型概率,因此任何文本无需标注即可作为训练数据。

由于GPT-3 更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的GPT-2。作为目前最大的密集型神经网络,GPT-3 能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且GPT-3 不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说GPT-3 似乎已经满足了我们对于语言专家的一切想像。

GPT-3 存在哪些局限性

但是GTP-3 并不完美,当前有人们最担忧人工智能的主要问题之一,就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏,地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出,这将会充分影响到它们的下一步应用。

OpenAI 也曾经提出,会在不久的将来发布更为强大的GPT-4:

据说,GPT-4 会在明年发布,它能够通过图灵测试,并且能够先进到和人类没有区别,除此之外,企业引进GPT-4 的成本也将大规模下降。

更强的GPT-4 上线!GPT-5 蓄势待发

2023 年3 月14 日,ChatGPT 开发商 OpenAI 宣布,最新版大型语言模型「GPT-4」上线,其准确度相较3.5 版本高出40%。

OpenAI 宣称,GPT-4 在许多专业测试的表现已「可媲美人类」(human-level performance),该模型能在美国大学的入学SAT测验击败90%人类、并在律师资格考试(Bar examination)击败90%受试者。

目前,GPT-4 已正式开放试用。

OpenAI 表示,GPT-4 将提供ChatGPT 付费订阅户使用,也可做为应用程式开发介面(API)的一部分,让程式设计师把这款AI整合至手中的app。而至于GPT-4 的API,现在OpenAI 开放了等待表单,未来使用者可以依照呼叫API 的次数付费。

除此之外,OpenAI 在3 月26 日公布了 GPT-4.5 的细节。根据官方给出的讯息,GPT-4.5 模型是GPT-4 和即将推出的GPT-5 之间的一个重要中间版本。而GPT-5 将在2023 Q4 推出,该模型或将实现AGI (通用人工智慧) 的目标。

ChatGPT怎么用

ChatGPT不只能回应广泛的主题问答,使用者纷纷想找出它的底线,以下是曾被测试的应用范围:

回覆客诉、客服对话:直接丢入客诉信件,请ChatGPT回应一段简短的信件。 故事创作:有人透过ChatGPT完成短篇故事,也有人结合ChatGPT与图像创作工具MidJourney完成图文并茂的儿童绘本——但此本书遭批评思虑不周、有抄袭嫌疑。 写程式:ChatGPT已依使用者需求,写出虚拟货币交易所的应用程式介面(API),为使用者下单。 翻译:输入中文或英文,能要求ChatGPT为你翻译成另一种语言。 修改文法错误:输入一大段文字后,能请ChatGPT为你判断哪些文法出错,甚至能告诉你原因、如何修正。 写诗、歌词:给予关键字,ChatGPT就能写出符合主题、字数的诗词或歌词等文字创作。 整理文字重点:能阅读长篇大论的文本,并条列、分类出重点,适合会议记录使用。

您也可以登录ChatGPT 探索其更多的用途。

木头姐预测:2023 年ChatGPT 应用将可达Google 搜索规模

方舟投资(Ark Invest)在2023 年2 月1 日发布「 Big Ideas 2023」展望报告中谈到ChatGPT 。

方舟表示在发布后的五天内,ChatGPT 用户数量就达到100 万人次,虽然运行该模型的推估成本目前是每次搜索约0.01 美元,但是莱特定律表明,到2030 年,ChatGPT 类型的应用将可以达到Google 搜索的部署规模,每日可处理85 亿次搜索。

到2030 年,预计AI 将使知识型员工生产率提高4 倍以上,若100% 采用AI,只要支出约41 兆美元,就可提高劳动生产率约200 兆美元,使约32 兆美元的知识工作者薪资相形见绌,并与当前预期的2030 年全球GDP 规模相匹敌。

ChatGPT 能否取代Google

外界公认ChatGPT 在AI 界最大的突破,就是能处理非常广泛的主题。再者,ChatGPT 以对话的方式进行互动,以人们无法企及的速度打包整理资讯,甚至能处理对话中出现的不同人物、地点和时间等资讯;可以把它理解成文字版的Siri 或Alexa,但ChatGPT 更能理解问题、更知道用户想要什么。

专家也认为,ChatGPT 首先威胁到的就是搜索引擎。比起一条条的蓝色连结列表,整理好的资讯、有逻辑的解释,似乎更吸引人。

那么,这是不是意味着我们不用再拿关键字去喂Google,就能直接获得想要的答案呢

接下来我们将从两点进行观察:

观察点一:ChatGPT可自行生成内容,并结合前后文意对话

目前搜索引擎的运作方式(如Google),是汇集大量资讯,而非创造资讯。透过在输入框输入关键字,搜索引擎会透过算法,抓取、索引以及排序匹配的资讯,然后再由用户寻找自己需要的内容。但ChatGPT 很不一样的是,可自己生成内容,给出单一、即时的答案,还能结合前后文意,进行多轮对话。

观察点二:ChatGPT能不能判断讯息真伪

不过,虽然ChatGPT 资料源自于大量网络内容,但也会有出错的时候;而使用搜索引擎可以从多个资料来源交叉对比。去年华盛顿大学语言学教授Emily Bender 与前Google 伦理AI 主管Timnit Gebru 合着的论文曾经提到这一点,AI 语言模型本质只是「随机鹦鹉」(stochastic parrots)也就是说,他们的知识仅来自训练数据中的统计规律,而不是像人类能对世界的复杂和抽象进行理解。

甚至,推特(Twitter)现任执行长伊隆.马斯克(Elon Musk)透露,ChatGPT 可以使用Twitter 资料库,且众所皆知Twitter 垃圾讯息泛滥。这表示ChatGPT 必然学到了许多缺少事实核查的内容,甚至被用来生成不实的消息、恶意散播。

因此,从现在来看,ChatGPT 取代Google 等搜索引擎的可能性是比较小的。因为现阶段的ChatGPT 仍旧与其他AI 聊天机器人有一样的问题,那就是会以不正确的答案或假讯息回应。开发人员也承认,该模型「有时会写出貌似合理、但不正确或荒谬的答案」,并指该模型由于接受了人类训练,可能回答会「过于冗长」,一些用户就反馈,该模型针对代数提供了详细、但不正确的解答,还会回答血腥、犯罪、种族主义的限制性议题。

总的来说,归根到底ChatGPT 是一款AI 对话模型,并非搜索引擎,无法提供各式资讯。而且我们平时在网络上搜索到的资料也并非完全正确,各式的资讯与内容仍需要我们自己去做判断。所以说,ChatGPT是不太可能取代搜索引擎Google 的。

ChatGPT 对话成本仅为几美分,仍值得期待

目前,ChatGPT 仍是免费试用转态。对于 ChatGPT 聊天的平均费用,OpenAI 执行长Sam Altman 表示,「每次对话的平均费用可能只有几美分,我们正试图寻找更精确的测量方法,并优化它。」

但Altman 也直言, ChatGPT 不会永久免费,「我们将不得不在某个时候,以某种方式将其货币化;因为成本高昂。」

不过,处于开发阶段的GPTChat 还是很令人惊艳,值得网友们去探索,发现聊天机器人的无限潜力。

ChatGPT的未来前景如何

矽谷乃至整个世界都在等待的是GPT-4 的到来。

GPT-4 确实很快就要来了(根据一些传言,这个时间可能是2023 年春天)。当它问世时,将会令ChatGPT 黯然失色;可以肯定的是,会有更多人讨论它……

GPT-4 很快就会面世,带来的经济冲击也许会像新冠疫情一样。GPT-4 的即时分发可为数亿知识工作者带来近乎即时的采用与近乎即时的生产力提升。

就技术而言,GPT-4 将内建更多的参数,而这需要将更多处理器和记忆体捆绑在一起,并用更多的资料进行训练。GPT-1 的训练量是4.6 GB 资料,GPT-2 的训练量是46 GB 资料,GPT-3 的训练量是750 GB 资料。GPT-4 的训练量将更可观,也许要占网络的很大一部分。正如OpenAI 已经了解到的那样,从很多方面来说,更大意味着更好,每次迭代的输出都会越来越像人类。GPT-4 会变成一个怪物。

但它能解决我们之前看到的问题吗我不太确定。

尽管GPT-4 看起来肯定要比它的前辈更聪明,但它的内部架构问题依旧。我怀疑我们会看到一个熟悉的模式:一开始火爆异常,接着接受更仔细的科学审查,然后是大家认识到许多问题仍然存在。