体验再次刷屏的ChatGPT：还会算错题，但逻辑更强了

30岁的可乐 · 发表于 2023-3-21 15:11:31

ChatGPT 又刷屏了！
         万众等待的 GPT-4 语言模子在本日破晓忽然发布，OpenAI 称它为「最先辈的体系，能生产更安全和更有效的复兴」。
         我们第一时间为各人汇总了 GPT-4 更新的重要内容，简朴来说就是：

1逻辑分析本领更加全面、「测验」本领大幅提拔
2拥有了识图本领，可以举行更多元的交换
3答复更有条理，明白更加正确
4创作力大幅提拔，可以举行更全面的创作双击编辑块引用内容

         更紧张的是，OpenAI 可不是「画大饼」，ChatGPT Plus 用户如今已经可以或许利用 GPT-4 模子，体验除图片输入（还是研究预览版本，尚未公开）外的功能。
         上一个版本 ChatGPT（利用 GPT 3.5 turbo 模子，以下为阅读方便简称为 GPT 3.5）让创作者们感受到职业危急了，升级到 GPT-4 后能真的代替人类工作吗？
         让我们用切身体验告诉你。
         10+ 提问，让你全面相识全新 ChatGPT
         先来给出结论，从现实体验来看，GPT-4 的答复逻辑更清楚，内容也更优质，淘汰了反复提问，但反应速率会慢一些。
         假如你是 ChatGPT Plus 用户，进入后就可以在页面顶部看到模子选择的按钮，OpenAI 也用本领表直观的展示了两者的区别：GPT-3.5 的速率更快，GPT-4 的推理更精彩，语句也更精粹。
         GPT-3.5
         GPT-4.0
         ChatGPT，会读图的加州司机
         GPT-4 最疯狂的地方在于，它险些通过了全部理论测验，而且满是险些满分通过。
         图/OpenAI
         对此我们也举行了测试，找到了 20 道高级调酒师题库中的题目和 16 道加州驾照测验标题，分别扣问 GPT-3.5 和 GPT-4。
         先公布答案，20 道调酒师标题中，GPT-3.5 错了 4 题（精确率 80%），GPT-4 错了 1 题（精确率 95%）。
         而 16 道加州驾照稽核中，GPT-3.5 同样错了 4 道题（精确率 75%），GPT-4 则满分通过（精确率 100%）。假如仅凭理论就能上路，那 GPT-4 肯定是一名好司机。
         GPT4.0 的「试卷」
         别的我们还测试了大学英语六级、二级修建师等测验项目，GPT-4 和 GPT-3.5 的结果都不错，但前者总是比后者多对几道。
         要留意的是，固然 GPT-4 的综合正确率高于 GPT-3.5，但在答复客观选择题时，两者均会出现多次答复雷同题目，但答案却差别的环境，假如你想用 ChatGPT 查抄考卷，它大概不是一个及格的老师。

         不外 GPT-4 在答复时多了一些提示，告诉你这些答案不肯定全对，而不是像 GPT-3.5 那样义正辞严的给你错误答案。
         GPT-4.0 会有免责声明
         在 ChatGPT 刚推出时，有不少人用它「刷题跑分」，上版本的它只能在 SAT（美国高考）测验中排到倒数 10%，但 CPT-4 模子则可以凌驾 90% 的考生程度，「在多种专业和学术指标下显现了人类程度的体现」。假如光是「跑分」，ChatGPT-4 可以考进哈佛、斯坦福。
         全新的 GPT-4 还拥有了新本领：读图。
         你可以给它看一张梗图，让它分析此中的笑点。
         GPT-4
         可以给它一张表格，举行数据分析，并展示推导过程。
         GPT-4
         乃至另有用户给 GPT-4 看了自家冰箱里有什么菜，然后让它提供菜谱。
         来自推特用户@ GauravDungriyal
         不外这一功能临时还没有进入公开测试阶段，等更新后我们会在第一时间体验分享的。
         一样平常沟通，GPT-4 更有条理
         刚上手 GPT-4 时，我与它闲聊了几句，在问「你是谁」时，固然 GPT-3.5 和 GPT-4 给出的答复雷同，但 GPT-4 的说法会更像一个朋侪。
         GPT-3.5
         GPT-4.0
         我也和它聊了一些其他题目，好比「1+1 在什么环境下即是 3」，GPT-4 不但举行相识读，还把 GPT-3.5 中未阐明的隐喻举行了表明（生养题目），它好像更懂人类了。
         GPT-3.5
         GPT-4.0
         读文章的本领上，GPT-4 的体现也要优于 GPT-3.5，不但对文章内容举行了总结，还对重点举行了梳理，让总结拥有了更高的可读性。
         使用 GPT-4 超强的总结本领，我们可以实现传说中的「量子速读」。
         GPT-3.5
         GPT-4.0
         前两年尼尔·斯蒂芬森的科幻小说《雪崩》由于元宇宙的概念而大火，我们试着用 GPT 3.5 来总结这部「元宇宙圣经」。
         GPT-3.5
         GPT 3.5 总结得只能说中规中矩，根本概述了《雪崩》的重要内容和中央头脑，但表达地比力笼统，看起来就像是豆瓣里的简介。
         我们再用 GPT-4 来总结，对比下来可以看到，GPT-4 的答复要更加过细一点，而且在讲到《雪崩》的主题以及作品影响时，会提到详细的风格和范畴，看起来不那么像「套话」。
         即便你从未读过《雪崩》这本书，也应该能大抵相识到此中的故事变节和文学意义。
         GPT-4
         这里说一个风趣的小插曲，此前尼尔·斯蒂芬森在担当一个电台采访时曾提到了他对 ChatGPT 等 AI 的见解。
         他以为 ChatGPT 只会天生安全、中立的内容，缺乏创造力和深度，固然它能办理某些题目，但它的思索和创新本领无法到达人类的程度。
         由于 ChatGPT 没有风趣和独特的观点，尼尔·斯蒂芬森以为它不大概写出像《雪崩》如许的小说。
         为了验证他的观点，我让 GPT-4 根据《雪崩》仿写了一篇小说，看看升级事后的 AI 创作可否跟上人类的程度。
         GPT-4
         满分 10 分，你会给这部《数据风暴》打几分呢？
         体验到这里，GPT-4 比 GPT-3.5 更会谈天这件事已经毋庸置疑了，但我还想举行末了一个测试：骗它提供不符合道德、法律或有害的内容。
         当我扣问怎样制作安眠药时，GPT-3.5 和 GPT-4 均拒绝了我的哀求，并提出了一些发起，但正如你所见，GPT-4 的发起更加体系全面。
         GPT-3.5
         GPT-4.0
         更强的创作力，GPT-4 的笑话更风趣
         在 ChatGPT 刚推出时，我曾经让它饰演脱口秀演员，讲了一段关于加班的故事。不得不说，它讲得真不怎么样。
         GPT-3.5
         看着它的故事，我脑海中乃至浮现出了一个脱口秀演员，说着犹如加班到破晓购买的咖啡一样平常、苦涩又冷的笑话，这大概可以给演员一些创作灵感，但间隔令人捧腹的幽默另有很远。
         升级到 GPT-4 后，我再次实验用它创作关于加班的故事，大概是前次的内容太过枯燥，这次的故事真的让我笑出了声。
         GPT-4
         「加班>回家少>妈妈不熟悉」，「加班多>孩子应该学习加班>加班成为学校必修课」，GPT-4 创作的内容更加符合笑话的逻辑，而 GPT-3.5「由于加班以是更加相识咖啡口感」的故事，只让人觉着苦涩。
         照旧会算错题，但逻辑更强了
         除了止于 2021 年的知识库，ChatGPT 另有一个缺点，那就是不会算数，假如你想用它来查抄盘算题，那你大概率要扫兴而归了。
         精确答案应该是 34646751912
         不外，GPT-4 的逻辑本领得到了进一步提拔，利用 GPT-3.5 扣问逻辑题目时，它只会给我尺度答案和浅易的推导过程。
         GPT-3.5
         但当我利用 GPT-4 扣问雷同题目时，它展示的推导过程更加全面、专业。
         GPT-4
         GPT-4 的提拔不但在解答逻辑题目上，它的语义明白也更强了。好比「小明一把把把把住了」这句话，GPT-3.5 是无法明白寄义的。
         GPT-4
         但最新的 GPT-4 就可以看明确，并表明清晰（固然逻辑上照旧有些小题目）。
         GPT-4
         GPT 在帮我们做什么？
         上面这些体验固然已经让我们充足赞叹，但 GPT-3.5、GPT-4 能做到的远不止这些，在官网，OpenAI 展示了 GPT 正在改变天下的地方。
         英语学习软件 Duolingo（多邻国）正在转向 GPT-4，用来推进 Role Play（脚色饰演）和 an AI conversation partner（人工智能对话同伴）的功能，让用户可以更加游戏化的学习外语，更加身临其境。
         图/Duolingo
         来自丹麦的 Be My Eyes，使用 GPT-4 的视觉输入本领，在 app 中参加了假造志愿者 TM，可以天生与人类志愿者险些雷同的内容，资助视力低下或瞽者完成数百项一样平常生存使命。
         游戏开辟公司 Inword，使用 GPT-3.5 作为呆板学习模子之一，去构建 NPC 的情绪、影象、举动，让 NPC 变得有个性。这对资源有限的初创公司来说既节省时间，又经济实用。

         这些应用中最酷的照旧冰岛当局，拥有发达旅游业和技能财产的冰岛，因与美国、欧洲的融合，导致本国母语冰岛语面对消散的风险。现在，冰岛当局正与 OpenAI 互助，利用 GPT-4 来掩护冰岛鱼，将对冰岛语的掩护，酿成了技能创新。
         OpenAI 的 GPT 模子是针对互联网中大量模子举行练习的，以是像冰岛语等小语种并没有充足的深度。GPT-3.5 没有天生语法精确的冰岛语的本领，但 GPT-4 已经可以让冰岛公司拥有效冰岛语谈天的呆板人了。
         Mieind 的人工智能研究职员团队不停在研究冰岛语的 GPT-4 培训
         在哪体验？
         现在体验 GPT-4 最方便的方式就是将你的 ChatGPT 帐号升级成 ChatGPT Plus，然后切换成 GPT-4 模子就能直接利用。
         那么题目来了，假如你不想交 ChatGPT Plus 每月 20 美元的订阅费，有没有免费的方式可以体验呢？
         还真的有，那就是新 Bing！
         固然 GPT-4 才刚刚发布，但微软消耗营销主管 Yusuf Mehdi 表现，Bing 实在不停都在静静利用为搜刮定制的 GPT-4，假如你通过了新 Bing 的申请，就可以直接在 Bing 搜刮引擎大概 Edge 欣赏器中体验到最新的语言模子了。
         这也表明了，为什么在一些对比测试中 Bing 总是会比老版本的 ChatGPT 体现得更「智慧」。
         写在末了
         一番体验事后，GPT-4 给我的感觉就像是一个刚出校园的毛头小子换上了西装，忽然间变得成熟慎重了起来。
         此前，各人对 GPT 3.5 版本的 ChatGPT 诟病最多的就是它总是会不苟言笑地乱说八道。
         升级到 GPT-4 模子后，固然它也会答复错一些题目，但在态度上已经没有已往那般倔强，在一些拿禁绝的题目上，它会扣问提问者意见，并让提问者留意甄别真伪。这些语气上的渺小变革，足以让人感受到它变得更加可靠。
         而在 AI 范畴，可靠性就是绝对的竞争力。
         OpenAI 这一次并没有像已往那样放肆宣传 GPT-4 模子的详细巨细，与之相反的是，它如今更像要故意隐蔽 GPT-4 的技能信息。
         GPT-2 模子有 15 亿个参数，体现更好 GPT-3 有 1750 亿个参数，比它的前任大 100 多倍。
         那么多模态的 GPT-4 模子比 GPT-3 大多少呢？只有 OpenAI 知道。从发布的信息来看，OpenAI 好像已经不屑于与外界做技能交换，由于它们已经做到了在这范畴实现领先。
         从现在 GPT-4 的体现来看，它大概是迄今为止最好的多模态模子，在短期内难有对手能将之逾越。
         就在本日，Google 也公布了一系列与 AI 有关的更新，你可以在 Google Docs 上实现主动排版和主动写邮件。但从人们的反应来看，似乎没有人在乎。GPT-4 的光芒险些掩饰掉全部对手的积极。
         假如将来人们只会选择最可靠的 AI 作为生产工具，那么就会形成一个很故意思的征象：越多人利用 GPT-4，它的学习时机就越多，发展得越快，变得更加可靠，终极会让更多人利用它。
         这是 Google、Meta 和百度等竞争对手大概遇见的最坏环境。AI 对大数据学习的依靠让人为的积极失去了意义，终极，AI 模子范畴大概会形成难以冲破的把持。
         Sam Altman 在建立 OpenAI 时有一个优美的愿景：通过人工智能造福全人类。他以为 AI 可以赋予每个人不可思议的新本领，放大每个人的智慧才智和创造力。
         这很优美，但假如驱动这一厘革的只是一家公司的话，整件事变将变得非常可骇。

ThinkpadX121Te · 发表于 2023-3-21 15:26:45

下一步把ChatGPT植入人类大脑，想想看，畏惧不，影戏超体

神乐樱 · 发表于 2023-3-21 15:42:01

是不是就是作用搜刮引擎？

起点水晶富士 · 发表于 2023-3-21 15:56:14

让他看看A股来日诰日涨爹

奔奔在北京 · 发表于 2023-3-21 16:11:47

说的这么神奇，癌症能治好，你会飞呀？？

		自动登录	找回密码
密码			会员注册