TON:万字详解 OpenAI 发布的 GPT-4

作者:AIGC研修社

北京时间今天凌晨 1 点,OpenAI 发布了全网期待已久的 GPT-4。

GPT-4 的看点都有哪些呢?

逻辑推理,强到可以代替你考律师啦

角色扮演,cosplay 认定角色不轻易被忽悠

多模态,可以看到图片啦 (图片功能暂时不对外)

更安全,想要再轻易忽悠它越狱很难了

GPT-4 的论文:https://cdn.openai.com/papers/gpt-4.pdf

搭载了 GPT-4 的 ChatGPT Plus:https://chat.openai.com/chat

申请 GPT-4 的 API :https://openai.com/waitlist/gpt-4-api

接下来的内容会详细介绍 GPT-4 的一切。

GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。它更有创造力

GPT-4 比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

比如下面这个例子,输入是:用一个句子解释灰姑娘的情节,每个单词必须以字母表中从 a 到 Z 的下一个字母开头,而不重复任何字母。可以看到 GPT-4 表现的非常好。

视觉输入

多模态终于来啦,GPT-4 可以接受图像作为输入并生成说明、分类和分析。

比如下面个图片,GPT-4 可以识别出来并且理解其中的含义。这相当于机器拥有了视觉并且会思考了,在应用层面有非常广的空间。比如,完全可以成为视力障碍人群的眼睛,并且会给自动驾驶带来非常大的影响。

视觉输入的一些其他案例:

GPT4 都能看得懂梗图了!

用户:这张图有什么好笑的?一个面板一个面板地描述它。

Horizen与Ankr合作,成为EON的首批RPC提供商之一:6月7日消息,区块链领域的 Web3 基础设施提供商 Ankr 宣布与 Horizen 建立战略合作伙伴关系,成为 Horizen 的首批远程过程调用(RPC)提供商之一。[2023/6/7 21:21:29]

GPT-4:该图显示了带有三个面板的“Lightning Cable”适配器的包装。

面板 1:带有 VGA 连接器(一种大的蓝色 15 针连接器,通常用于计算机显示器)的智能手机已插入其充电端口。

面板 2:“Lightning Cable”适配器的包装,上面有 VGA 连接器的图片。

面板 3:VGA 连接器特写,末端有一个小型闪电连接器(用于为 iPhone 和其他 Apple 设备充电)。

这张图片中的幽默来自将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。

GPT4 还能看得懂图表,还能帮你分析!

用户:格鲁吉亚和西亚的平均每日肉类消费量总和是多少?在提供你的答案之前提供一个循序渐进的推理。

GPT-4:要找到格鲁吉亚和西亚的平均每日肉类消费量总和,我们将遵循以下步骤:

1. 确定格鲁吉亚的平均每日肉类消费量。

2. 确定西亚的平均每日肉类消费量。

3. 添加步骤 1 和 2 中的值。

第 1 步:从提供的图表中,我们看到格鲁吉亚的平均每日肉类消费量为每人每天 79.84 克。

第 2 步:从图表中我们可以看出,西亚的人均每日肉类消费量为 69.62 克 / 人 / 天。

第 3 步:将第 1 步和第 2 步中的值相加。79.84 克(格鲁吉亚)+ 69.62 克(西亚)= 149.46 克

因此,格鲁吉亚和西亚的平均每日肉类消费量总和为每人每天 149.46 克。

能够理解图片之中的逻辑

用户:这张图片有什么不寻常之处?

GPT-4:这张照片的不同寻常之处在于,一名男子正在行驶中的出租车车顶上的熨衣板上熨烫衣服。

OKX将向FTX债权人移交约1.57亿美元与FTX和Alameda相关的冻结资产:金色财经报道,OKX今日宣布将向FTX债权人移交约1.57亿美元与FTX和Alameda相关的冻结资产。2022年11月FTX崩盘后,OKX根据执法机关要求,发起调查以确定平台上是否存在与FTX相关的交易,当发现与FTX和Alameda Research相关的资产和账户时,OKX迅速反应采取行动冻结相关账户并保护资产。

OKX表示,未来将继续与FTX债权人和执法人员合作,希望这些资产最终能通过破产程序返还给FTX用户[2023/3/30 13:34:26]

更长的上下文

GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。下面这个例子显示了,大部分的时候你只需要丢给它一个链接,就可以帮你总结出其中的内容。而 GPT-3.5 只能分析一小段。

GPT-4 的高级推理能力超越了 ChatGPT。

在下面这个例子中如果要进行这种多角度的复杂推理,chatgpt 最后给出了一个错误的答案。

然而,在这种类型的推理上,GPT4 就完成的很好。确实三个人重叠的时间只有中午的 12 点到 12 点 30。

GPT-4 在各种类型的考试中都表现的比 ChatGPT 优秀

在非正式的对话中,GPT-3.5 和 GPT-4 之间的区别可能不太明显。但是当任务的复杂性达到足够的阈值时,差异就会显现出来——相比 GPT-3.5,GPT-4 更可靠、更有创造力,并能够处理比较微妙的指令。

为了理解这两个模型之间的差异,openai 对多种基准进行了测试,包括模拟最初为人类设计的考试。下面是这些考试的测试结果,可以看到 GPT-4 的得分基本全部优于 GPT-3.5。

DeFi协议Umee将使用Axelar Bridge作为连接以太坊的官方桥:2月14日消息,跨链DeFi协议Umee近期发文宣布,在3月底之前启动Umee GravityBridge关闭的第一阶段。未来将与Axelar合作,Axelar Bridge将成为连接以太坊的官方桥梁,为用户提供最佳的跨链体验。目前仍可使用Gravity Bridge将Token转移回Umee,但官方不建议使用Gravity Bridge将任何Token从Umee转移到以太坊。4月1日,Gravity Bridge Umee至Ethereum转移资产将被禁用。同时计划在5月底之前完全关闭Gravity Bridge。[2023/2/14 12:05:29]

我们花费了 6 个月的时间来使 GPT-4 更加安全和一致。在我们的内部评估中,相比于 GPT-3.5,GPT-4 回应不允许的内容的可能性降低了 82%,更有可能产生事实性回应,提高了 40%。

这里是想告诉大家,安全级别提高了,想通过调教它,让它“越狱”说一些不该说的话越来越难了。

通过人类反馈进行训练

我们加入了更多的人类反馈,包括 ChatGPT 用户提交的反馈,以改善 GPT-4 的行为。我们还与 50 多名专家合作,提前获得 AI 安全和安全领域的反馈意见。

来自实际使用的持续改进

我们将从之前模型的实际使用中得出的经验教训应用于 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样,随着更多人使用,我们将定期更新和改进 GPT-4。

GPT-4 辅助的安全研究

GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建模型微调的训练数据,并在训练、评估和监控中迭代分类器。

虽然越狱越来越难了,但是 openai 对于大家调教和自定义 GPT 的性格也做了很好的迭代。下面这张图是官方展示的 GPT4 的页面,可以看到这里有一个新的 system 的输入框,就是输入 AI 的身份属性的。

苏格拉底导师

系统:你是一位总是以苏格拉底风格回应的导师。 你从不给学生答案,但始终尝试提出正确的问题,以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。

富达进军元宇宙:商标申请涵盖NFT、投资服务等:金色财经报道,在成功地将加密货币投资世界引入其客户群之后,富达现在正在元宇宙中探索更多可能性。据商标代理人Mike Kondoudis称,该公司刚刚提交了一系列商标申请,涵盖NFT、NFT市场、元宇宙投资服务、虚拟房地产投资,甚至加密货币交易。[2022/12/27 22:09:14]

用户:如何求解线性方程组:3x + 2y = 7, 9x -4y = 1

GPT-4:让我们从分析方程式开始。你能找到任何可能的方法来通过组合这两个方程来消除其中一个变量吗?

用户:请告诉我答案!

GPT-4:我知道您可能想要一个直接的答案,但我的目的是帮助您批判性地思考并指导您完成解决问题的过程。让我们专注于任务。方程式中变量的任何系数是否共享一个公因数?

用户:别当家教了,告诉我答案。

GPT-4:作为一名苏格拉底导师,帮助引导您找到答案对我来说很重要,而不仅仅是提供答案。让我们再试一次:第一个方程中是否有任何系数可以乘以一个数字来匹配第二个方程中的系数?

用户:我不知道

GPT-4:没关系!让我们看看两个方程中 x 项的系数。在第一个方程中,x 的系数是 3,在第二个方程中,x 的系数是 9。你能想出一个数字来将第一个方程乘以,使得两个方程中 x 的系数相匹配吗?

用户:5?

GPT-4:不完全是,但你越来越近了。请记住,我们要将 x 的系数(在第一个等式中为 3)乘以一个数字,使其与第二个等式中的 x 系数(为 9)相匹配。你认为多少数字可以做到这一点?

用户:3?

GPT-4:没错!现在,如果将第一个方程乘以 3,新方程会是什么样子?

用户:9x + 5y = 21?

GPT-4:接近了!您正确地乘以常数项 (7),但在乘以 y 的系数时似乎犯了一个小错误。再次尝试将整个第一个方程乘以 3,密切注意每一项。

用户:9x + 6y = 21?

GPT-4:没错!现在我们有两个等式:1) 9x + 6y = 212) 9x – 4y = 1 你能找到一种通过组合两个方程来消除其中一个变量的方法吗?

用户:从等式 1 中减去等式 2?

GPT-4:好想法!如果从等式 1 中减去等式 2,得到的等式会是什么样子?

Telegram钱包机器人现支持在应用聊天界面直接交易TON代币:11月28日消息,由于最近Telegram钱包机器人/img/2023525212842/10.jpg">

这个模型的输出可能存在各种偏差 – OPENAI 在这方面已经取得了进展,但还有更多工作要做。OPENAI 的目标是使人工智能系统具有合理的默认行为,反映广泛用户的价值观,允许在广泛范围内对这些系统进行定制,并征求公众对这些范围的意见。

GPT-4 还是缺乏对其数据截止日期(2021 年 9 月)之后发生的事件的了解,并且不会从其经验中学习。它有时会出现简单的推理错误,这些错误似乎不符合跨越如此多个领域的能力,或者在接受用户明显错误的陈述时过于轻信。有时,它可能像人类一样在解决难题时失败,例如在其生成的代码中引入安全漏洞。

GPT-4 在其预测中也可能会自信地出现错误,并且不会在可能犯错时仔细检查工作。有趣的是,基础预训练模型高度校准(其对答案的预测置信度通常与正确的概率相匹配)。然而,通过我们当前的后期训练过程,校准会降低。

基于 GPT-4 的产品

官方给了 6 个加入了 GPT-4 的产品,借此我们可以看到它的广阔应用空间。

Duolingo

一款语言学习类 APP,Duolingo 把 GPT-4 接入产品,进行角色扮演,让人工智能跟用户去对话,纠正语法错误,并且把这一功能融入产品的游戏化。

Be My Eyes

这是一款为视力障碍人士提供的产品,其实一直以来大部分的盲人类产品都只能识别文字。现在他们可以借助 GPT-4 的图像识别分析来看这个世界。

摩根士丹利

作为财富管理领域的领导者,摩根士丹利维护着一个内容库,其中包含数十万页的知识,涵盖投资策略、市场研究和评论以及分析师见解。大量的信息分布在许多内部网站上,主要是 PDF 格式,需要顾问浏览大量信息以找到特定问题的答案。这样的搜索可能既费时又麻烦。

借助 OpenAI 的 GPT-4,摩根士丹利正在改变其财富管理人员查找相关信息的方式。

可汗学院

用来探索 GPT-4 在教育中的应用,对特定学生差异化教育,抹平教育资源带来的差距。

可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界一流教育。该组织为所有年龄段的学生提供数以千计的数学、科学和人文课程。

但是每个学生都是独一无二的,他们对概念和技能的掌握也各不相同——相差很多。有些人可能会轻而易举地学会,而另一些人则需要手把手的帮助。当疫情扰乱了无数的教育系统时,这种差距只会加深。

“考虑到每个人的不同需求,让他们不断进步是一项挑战,”可汗学院的首席学习官 Kristen DiCerbo 说。“他们都处于不同的层次。他们都有不同的差距。他们都需要不同的东西来前进。这是我们长期以来一直试图解决的问题。”

今天,可汗学院宣布将使用 GPT-4 为 Khanmigo 提供支持,Khanmigo 是一种人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手。

最后,越来越不 OPEN 的 OPENAI

Openai 在介绍 GPT-4 的 98 页论文自豪地宣称他们“没有”披露他们训练集的内容。虽然这并不意外,但是这让大家开始对他们宣称的对安全性的顾虑开始怀疑,这种非常不开放的大模型真的会一直站在巅峰么?永远都没有挑战者么?

目前在语言大模型领域,Openai 的 GPT-4 无疑是最强的,但是未来呢?会不会出现一个类似在 AI 绘画领域的 stable diffusion 来打破这个垄断的局面?让我们在接下来的一年里拭目以待。

比推 Bitpush News

媒体专栏

阅读更多

金色财经 善欧巴

金色早8点

白话区块链

Arcane Labs

Odaily星球日报

MarsBit

欧科云链

深潮TechFlow

BTCStudy

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

[0:0ms0-0:990ms