跨境派

跨境派

跨境派,专注跨境行业新闻资讯、跨境电商知识分享!

当前位置:首页 > 卖家故事 > GPT4.5发布了?OpenAI终于发布正式版Turbo,重回AI王座第一

GPT4.5发布了?OpenAI终于发布正式版Turbo,重回AI王座第一

时间:2024-04-23 12:55:26 来源:网络cs 作者:言安琪 栏目:卖家故事 阅读:

标签: 发布  正式 
阅读本书更多章节>>>>

令人惊讶的是,短短三个月内,全球最强AI的称号又一次易主了!几个月前,Claude3 Opus的性能全面超过了GPT-4,全球网友纷纷转向Claude3,并分享了他们对Claude3的惊艳体验。

然而,OpenAI最近再次展示了其实力,证明GPT系列仍然是AI领域的领头羊。在最新的AI基准测试中,OpenAI几天前发布的GPT-4-Turbo-2024-04-09版本,显著超越了Claude3 Opus,再次夺回了全球AI领域的领先地位。

7fc98f28cfed1fb303abc5905a9a6ffe.jpeg

值得一提的是,这个版本不是一个普通的测试版本,而是作为一个正式版本GPT-4-Turbo发布的。

这也是GPT-4-Turbo系列首次发布正式版,足以看出这个版本的份量。网友甚至纷纷直接将其改名为GPT-4.5-Turbo了。

笔者第一时间通过国内最稳、更新最快的AI镜像站AskManyAI进行了GPT-4.5-Turbo体验。

12eb856d0eb1877a8a64d95c032fa8e7.jpeg

附AskManyAI地址(GPT-4、Claude3、Gemini都是最新版本):

https://askmanyai.cn

值得一提的是,AskManyAI的有个独特的AI混战模式,你的一个问题,可以指定多个最强的AI同时给你回答,简直就是做大模型测试的理想环境:

5be64c190ffdd7576a8a84f476af343e.jpeg

好了,话不多说,我们这就开始测评了!

最新版GPT-4.5-Turbo 大战 Claude 3 Opus

代码能力测试

首先我们来看看代码debug方面的表现:

98a97ba2cc1f24a5cbac76b74d7c5bbd.jpeg8b711568a6cd2f220741dba84604ab65.jpeg33f8a50d32447a5b609001fe56210d38.jpeg

这是一个很隐蔽的bug,Claude 3 Opus完全没找到bug在哪,其实这个bug,以前的GPT-4也找不到。但是刚刚更新的这个GPT-4.5-Turbo竟然找到了bug!

而且给到了非常正确的修复bug后的代码!

简直惊呆我了,这是第一个能修复这个bug的AI。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

科研学术能力测试

然后我们来看看专业学术问题的表现。

我们这次加大难度,上传一个生物样品图片给AI:

e53767978cd35086e7e3e831798a8fe0.jpeg

然后我们在AskManyAI网站同时选中Claude、GPT和Gemini这三个地表最强的多模态AI,看他们对这个图片分析的结果:

d83789e81f4718d5d3a1059d4fc361a3.jpeg

结果发现,最新版的GPT-4在图片问答方面还是不如Claude-3 Opus。这方面的能力排序是 Claude-3 > Gemini Pro > GPT-4。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

我们再换一个专业问题:

7010a700a2405f74014d69c18da7bf77.jpeg

8e717a5a2f3c5c3092bdbbe72c13a006.jpeg4a292eb48137da5eacb7fdb32ead0048.jpeg74a5a699da58403744342fecd7af67fb.jpeg

关于Sora技术原理的解释,所有的AI中,只有最新的GPT-4没有出现知识性的错误,Kimi和Gemini的错误是最离谱的,竟然说Sora是GAN的架构。。。而Claude-3的视频片段选择这个地方的讲解出现了错误——Sora是生成式的,不是检索式的。

我猜测这可能是因为只有GPT-4的知识库已经更新到了2024年的4月份。而Sora是2月份刚发布的,所以只有GPT-4学到了这方面的知识。

最新版GPT-4完胜!

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

营销能力测试

这次测试加大难度,直接丢给AI一个产品文档PDF,让他去生成一篇营销文案和搜索SEO的标题。

dcb48b652f4001cecef18c311d33e51e.jpeg

同样,这次GPT-4完胜!

AI写作能力测试

最后测试下AI写作能力!

c3f7b108f9b94975098136c0346986b1.jpegeeaaf0531b23282032e9ea9e7a24d323.jpegdb14acfca1136fa0b92b3bd172bd09fa.jpeg0a75d9f13007f05791b84496e1c958c1.jpeg11114fd4e7028029f8e36587d5ac7791.jpeg0dcc11c78590edab4d7cfec816b4fd45.jpeg658a6d34f8933e5215ed0af210cfa5a8.jpeg

写作的测试结果就要见仁见智了,每个人的看法都可能不一样。

这里面我最喜欢的是GPT-4和Claude-3写的文章,但Gemini Pro的写作速度非常快,不到5秒就写完了全篇。而GPT-4和Claude-3则写了一分钟不止。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

好了,今天的评测就到这里了。你们更喜欢哪个AI呢?

阅读本书更多章节>>>>

本文链接:https://www.kjpai.cn/gushi/2024-04-23/161477.html,文章来源:网络cs,作者:言安琪,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

文章评论