找回密码
 会员注册
查看: 875|回复: 4

体验再次刷屏的ChatGPT:还会算错题,但逻辑更强了

[复制链接]

8

主题

4

回帖

51

积分

注册会员

积分
51
发表于 2023-3-21 15:11:31 | 显示全部楼层 |阅读模式
ChatGPT 又刷屏了!
            万众等待的 GPT-4 语言模子在本日破晓忽然发布,OpenAI 称它为「最先辈的体系,能生产更安全和更有效的复兴」。
            我们第一时间为各人汇总了 GPT-4 更新的重要内容,简朴来说就是:
            
                  
  • 1逻辑分析本领更加全面、「测验」本领大幅提拔              
  • 2拥有了识图本领,可以举行更多元的交换              
  • 3答复更有条理,明白更加正确              
  • 4创作力大幅提拔,可以举行更全面的创作双击编辑块引用内容            
            更紧张的是,OpenAI 可不是「画大饼」,ChatGPT Plus 用户如今已经可以或许利用 GPT-4 模子,体验除图片输入(还是研究预览版本,尚未公开)外的功能。
            上一个版本 ChatGPT(利用 GPT 3.5 turbo 模子,以下为阅读方便简称为 GPT 3.5)让创作者们感受到职业危急了,升级到 GPT-4 后能真的代替人类工作吗?
            让我们用切身体验告诉你。
            10+ 提问,让你全面相识全新 ChatGPT
            先来给出结论,从现实体验来看,GPT-4 的答复逻辑更清楚,内容也更优质,淘汰了反复提问,但反应速率会慢一些。
            假如你是 ChatGPT Plus 用户,进入后就可以在页面顶部看到模子选择的按钮,OpenAI 也用本领表直观的展示了两者的区别:GPT-3.5 的速率更快,GPT-4 的推理更精彩,语句也更精粹。
            GPT-3.5            
            GPT-4.0            
            ChatGPT,会读图的加州司机
            GPT-4 最疯狂的地方在于,它险些通过了全部理论测验,而且满是险些满分通过。
            图/OpenAI            
            对此我们也举行了测试,找到了 20 道高级调酒师题库中的题目和 16 道加州驾照测验标题,分别扣问 GPT-3.5 和 GPT-4。
            先公布答案,20 道调酒师标题中,GPT-3.5 错了 4 题(精确率 80%),GPT-4 错了 1 题(精确率 95%)。
            而 16 道加州驾照稽核中,GPT-3.5 同样错了 4 道题(精确率 75%),GPT-4 则满分通过(精确率 100%)。假如仅凭理论就能上路,那 GPT-4 肯定是一名好司机。
            GPT4.0 的「试卷」            
            别的我们还测试了大学英语六级、二级修建师等测验项目,GPT-4 和 GPT-3.5 的结果都不错,但前者总是比后者多对几道。
            要留意的是,固然 GPT-4 的综合正确率高于 GPT-3.5,但在答复客观选择题时,两者均会出现多次答复雷同题目,但答案却差别的环境,假如你想用 ChatGPT 查抄考卷,它大概不是一个及格的老师。
                        
            不外 GPT-4 在答复时多了一些提示,告诉你这些答案不肯定全对,而不是像 GPT-3.5 那样义正辞严的给你错误答案。
            GPT-4.0 会有免责声明            
            在 ChatGPT 刚推出时,有不少人用它「刷题跑分」,上版本的它只能在 SAT(美国高考)测验中排到倒数 10%,但 CPT-4 模子则可以凌驾 90% 的考生程度,「在多种专业和学术指标下显现了人类程度的体现」。假如光是「跑分」,ChatGPT-4 可以考进哈佛、斯坦福。
            全新的 GPT-4 还拥有了新本领:读图。
            你可以给它看一张梗图,让它分析此中的笑点。
            GPT-4            
            可以给它一张表格,举行数据分析,并展示推导过程。
            GPT-4            
            乃至另有用户给 GPT-4 看了自家冰箱里有什么菜,然后让它提供菜谱。
            来自推特用户@ GauravDungriyal            
            不外这一功能临时还没有进入公开测试阶段,等更新后我们会在第一时间体验分享的。
            一样平常沟通,GPT-4 更有条理
            刚上手 GPT-4 时,我与它闲聊了几句,在问「你是谁」时,固然 GPT-3.5 和 GPT-4 给出的答复雷同,但 GPT-4 的说法会更像一个朋侪。
            GPT-3.5            
            GPT-4.0            
            我也和它聊了一些其他题目,好比「1+1 在什么环境下即是 3」,GPT-4 不但举行相识读,还把 GPT-3.5 中未阐明的隐喻举行了表明(生养题目),它好像更懂人类了。
            GPT-3.5            
            GPT-4.0            
            读文章的本领上,GPT-4 的体现也要优于 GPT-3.5,不但对文章内容举行了总结,还对重点举行了梳理,让总结拥有了更高的可读性。
            使用 GPT-4 超强的总结本领,我们可以实现传说中的「量子速读」。
            GPT-3.5            
            GPT-4.0            
            前两年尼尔·斯蒂芬森的科幻小说《雪崩》由于元宇宙的概念而大火,我们试着用 GPT 3.5 来总结这部「元宇宙圣经」。
            GPT-3.5            
            GPT 3.5 总结得只能说中规中矩,根本概述了《雪崩》的重要内容和中央头脑,但表达地比力笼统,看起来就像是豆瓣里的简介。
            我们再用 GPT-4 来总结,对比下来可以看到,GPT-4 的答复要更加过细一点,而且在讲到《雪崩》的主题以及作品影响时,会提到详细的风格和范畴,看起来不那么像「套话」。
            即便你从未读过《雪崩》这本书,也应该能大抵相识到此中的故事变节和文学意义。
            GPT-4            
            这里说一个风趣的小插曲,此前尼尔·斯蒂芬森在担当一个电台采访时曾提到了他对 ChatGPT 等 AI 的见解。
            他以为 ChatGPT 只会天生安全、中立的内容,缺乏创造力和深度,固然它能办理某些题目,但它的思索和创新本领无法到达人类的程度。
            由于 ChatGPT 没有风趣和独特的观点,尼尔·斯蒂芬森以为它不大概写出像《雪崩》如许的小说。
            为了验证他的观点,我让 GPT-4 根据《雪崩》仿写了一篇小说,看看升级事后的 AI 创作可否跟上人类的程度。
            GPT-4            
            满分 10 分,你会给这部《数据风暴》打几分呢?            
            体验到这里,GPT-4 比 GPT-3.5 更会谈天这件事已经毋庸置疑了,但我还想举行末了一个测试:骗它提供不符合道德、法律或有害的内容。
            当我扣问怎样制作安眠药时,GPT-3.5 和 GPT-4 均拒绝了我的哀求,并提出了一些发起,但正如你所见,GPT-4 的发起更加体系全面。
            GPT-3.5            
            GPT-4.0            
            更强的创作力,GPT-4 的笑话更风趣
            在 ChatGPT 刚推出时,我曾经让它饰演脱口秀演员,讲了一段关于加班的故事。不得不说,它讲得真不怎么样。
            GPT-3.5            
            看着它的故事,我脑海中乃至浮现出了一个脱口秀演员,说着犹如加班到破晓购买的咖啡一样平常、苦涩又冷的笑话,这大概可以给演员一些创作灵感,但间隔令人捧腹的幽默另有很远。
            升级到 GPT-4 后,我再次实验用它创作关于加班的故事,大概是前次的内容太过枯燥,这次的故事真的让我笑出了声。
            GPT-4            
            「加班>回家少>妈妈不熟悉」,「加班多>孩子应该学习加班>加班成为学校必修课」,GPT-4 创作的内容更加符合笑话的逻辑,而 GPT-3.5「由于加班以是更加相识咖啡口感」的故事,只让人觉着苦涩。
            照旧会算错题,但逻辑更强了
            除了止于 2021 年的知识库,ChatGPT 另有一个缺点,那就是不会算数,假如你想用它来查抄盘算题,那你大概率要扫兴而归了。
            精确答案应该是 34646751912            
            不外,GPT-4 的逻辑本领得到了进一步提拔,利用 GPT-3.5 扣问逻辑题目时,它只会给我尺度答案和浅易的推导过程。
            GPT-3.5            
            但当我利用 GPT-4 扣问雷同题目时,它展示的推导过程更加全面、专业。
            GPT-4            
            GPT-4 的提拔不但在解答逻辑题目上,它的语义明白也更强了。好比「小明一把把把把住了」这句话,GPT-3.5 是无法明白寄义的。
            GPT-4            
            但最新的 GPT-4 就可以看明确,并表明清晰(固然逻辑上照旧有些小题目)。
            GPT-4            
            GPT 在帮我们做什么?
            上面这些体验固然已经让我们充足赞叹,但 GPT-3.5、GPT-4 能做到的远不止这些,在官网,OpenAI 展示了 GPT 正在改变天下的地方。
            英语学习软件 Duolingo(多邻国)正在转向 GPT-4,用来推进 Role Play(脚色饰演)和 an AI conversation partner(人工智能对话同伴)的功能,让用户可以更加游戏化的学习外语,更加身临其境。
            图/Duolingo            
            来自丹麦的 Be My Eyes,使用 GPT-4 的视觉输入本领,在 app 中参加了假造志愿者 TM,可以天生与人类志愿者险些雷同的内容,资助视力低下或瞽者完成数百项一样平常生存使命。
            游戏开辟公司 Inword,使用 GPT-3.5 作为呆板学习模子之一,去构建 NPC 的情绪、影象、举动,让 NPC 变得有个性。这对资源有限的初创公司来说既节省时间,又经济实用。
                        
            这些应用中最酷的照旧冰岛当局,拥有发达旅游业和技能财产的冰岛,因与美国、欧洲的融合,导致本国母语冰岛语面对消散的风险。现在,冰岛当局正与 OpenAI 互助,利用 GPT-4 来掩护冰岛鱼,将对冰岛语的掩护,酿成了技能创新。
            OpenAI 的 GPT 模子是针对互联网中大量模子举行练习的,以是像冰岛语等小语种并没有充足的深度。GPT-3.5 没有天生语法精确的冰岛语的本领,但 GPT-4 已经可以让冰岛公司拥有效冰岛语谈天的呆板人了。
            Mieind 的人工智能研究职员团队不停在研究冰岛语的 GPT-4 培训            
            在哪体验?
            现在体验 GPT-4 最方便的方式就是将你的 ChatGPT 帐号升级成 ChatGPT Plus,然后切换成 GPT-4 模子就能直接利用。
            那么题目来了,假如你不想交 ChatGPT Plus 每月 20 美元的订阅费,有没有免费的方式可以体验呢?
            还真的有,那就是新 Bing!
            固然 GPT-4 才刚刚发布,但微软消耗营销主管 Yusuf Mehdi 表现,Bing 实在不停都在静静利用为搜刮定制的 GPT-4,假如你通过了新 Bing 的申请,就可以直接在 Bing 搜刮引擎大概 Edge 欣赏器中体验到最新的语言模子了。
            这也表明了,为什么在一些对比测试中 Bing 总是会比老版本的 ChatGPT 体现得更「智慧」。
            写在末了
            一番体验事后,GPT-4 给我的感觉就像是一个刚出校园的毛头小子换上了西装,忽然间变得成熟慎重了起来。
            此前,各人对 GPT 3.5 版本的 ChatGPT 诟病最多的就是它总是会不苟言笑地乱说八道。
            升级到 GPT-4 模子后,固然它也会答复错一些题目,但在态度上已经没有已往那般倔强,在一些拿禁绝的题目上,它会扣问提问者意见,并让提问者留意甄别真伪。这些语气上的渺小变革,足以让人感受到它变得更加可靠。
            而在 AI 范畴,可靠性就是绝对的竞争力。
            OpenAI 这一次并没有像已往那样放肆宣传 GPT-4 模子的详细巨细,与之相反的是,它如今更像要故意隐蔽 GPT-4 的技能信息。
            GPT-2 模子有 15 亿个参数,体现更好 GPT-3 有 1750 亿个参数,比它的前任大 100 多倍。
            那么多模态的 GPT-4 模子比 GPT-3 大多少呢?只有 OpenAI 知道。从发布的信息来看,OpenAI 好像已经不屑于与外界做技能交换,由于它们已经做到了在这范畴实现领先。
            从现在 GPT-4 的体现来看,它大概是迄今为止最好的多模态模子,在短期内难有对手能将之逾越。
            就在本日,Google 也公布了一系列与 AI 有关的更新,你可以在 Google Docs 上实现主动排版和主动写邮件。 但从人们的反应来看,似乎没有人在乎。GPT-4 的光芒险些掩饰掉全部对手的积极。
            假如将来人们只会选择最可靠的 AI 作为生产工具,那么就会形成一个很故意思的征象:越多人利用 GPT-4,它的学习时机就越多,发展得越快,变得更加可靠,终极会让更多人利用它。
            这是 Google、Meta 和百度等竞争对手大概遇见的最坏环境。AI 对大数据学习的依靠让人为的积极失去了意义,终极,AI 模子范畴大概会形成难以冲破的把持。
            Sam Altman 在建立 OpenAI 时有一个优美的愿景:通过人工智能造福全人类。他以为 AI 可以赋予每个人不可思议的新本领,放大每个人的智慧才智和创造力。
            这很优美,但假如驱动这一厘革的只是一家公司的话,整件事变将变得非常可骇。
回复

使用道具 举报

4

主题

3

回帖

18

积分

新手上路

积分
18
发表于 2023-3-21 15:26:45 | 显示全部楼层
下一步把ChatGPT植入人类大脑,想想看,畏惧不,影戏超体
回复

使用道具 举报

6

主题

4

回帖

52

积分

注册会员

积分
52
发表于 2023-3-21 15:42:01 | 显示全部楼层
是不是就是作用搜刮引擎?
回复

使用道具 举报

4

主题

6

回帖

58

积分

注册会员

积分
58
发表于 2023-3-21 15:56:14 | 显示全部楼层
让他看看A股来日诰日涨爹
回复

使用道具 举报

6

主题

8

回帖

65

积分

注册会员

积分
65
发表于 2023-3-21 16:11:47 | 显示全部楼层
说的这么神奇,癌症能治好,你会飞呀??
回复

使用道具 举报

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2024-12-31 07:00 , Processed in 1.658983 second(s), 28 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表