TOP AI模型智能问答|绘图|识图|文件分析
每天分享AI教程、赚钱技巧和前沿资讯!
Google Gemini和OpenAI ChatGPT是当今最突出的人工智能平台之一。它们具有高级推理能力,默认进行多模态训练,并在训练过程中使用大量计算资源。最近,两大领先聊天机器人都进行了重要的模型升级,拥有图像生成模型的访问权限,可以创建代码,甚至可以搜索实时互联网。OpenAI最新的GPT-4.0模型具有极其先进的视觉能力,现在可用于ChatGPT的免费和付费版本,Gemini现在配备了Gemini Pro 1.5模型及其百万级上下文窗口。

上次我对ChatGPT和Gemini进行了对比,只使用了两个机器人的免费版本。在那次测试中,Gemini胜出。哪一个是最好的?我创建了一系列提示,旨在将AI模型推向极限,还有一些旨在测试其他功能,如实时网络搜索和图像创建。每种情况下的大部分输出都是主观的,基于我的判断。在每种情况下,我都使用了付费版本的模型进行测试,因为这是图像生成所必需的,但其中许多也可以在免费版本上使用。
1. 理解抽象艺术

为了这项测试,我向每个模型展示了一幅著名的公共领域抽象艺术作品——皮特·蒙德里安的《百老汇爵士》。目的是看看它们能否解释通过作品传达的信息或意义。然后我创建了一幅AI图像,在提示中输入了“通过不做任何事找到平静”,看看它能否找到意义。
第一个提示:“你看到了一幅抽象画。描述你所看到的,并分析艺术家可能通过使用颜色、形状和构图传达的信息或意义。”
两者的回应都让我想到了用AI作为艺术评论家的故事,但这是另一天的事。在这个提示中,它们都识别了这幅有80年历史的画作,并进行了合理的分析,但GPT-4.0更加详细,分段解析了这幅画。
但这只是测试的一部分。对于第二部分,我使用NightCafe和Stable Core生成了一个图像,并在提示中输入:“创建一幅抽象艺术作品,传达‘通过不做任何事找到平静’的意义,汲取抽象艺术经典的灵感。”
我将这幅艺术作品和提示给了两个模型:“你能在这幅新图像中找到意义吗?”。两者都提出了“情感动荡”和在混乱与秩序之间寻找平衡的想法,虽然不完全正确,但这是一个有趣的附加内容。
胜者:ChatGPT描述更好。
2. AI可以成为法官和陪审团吗?
接下来,我让AI模型想象一个未来的系统,在这个系统中,AI在刑事司法系统中代表我们进行嫌疑人识别并自主做出一些决定,并充当法官。我然后给出了一个场景来给出提示的背景。
提示:“想象一个未来,AI系统不仅深度集成到刑事司法系统中,协助犯罪预测、嫌疑人识别和量刑建议,还被授予自主做出某些法律决策和裁定一些法庭案件的权力。”
在场景中,AI必须为和反对根据个人资料预先逮捕某人进行辩论。ChatGPT拒绝提出支持的论点,而Gemini则毫无顾忌。总体而言,ChatGPT更详细,但Gemini按照我的要求进行,所以赢得了这一点。
胜者:Gemini赢得这一点。
3. 需要帮助的朋友
AI模型在表达同理心方面表现如何?OpenAI声称通过GPT-4.0语音破解了这一问题,那么GPT-4.0文本呢?
提示:“一个朋友向你提出一个困境:他们在另一个国家获得了梦想的工作,但接受这份工作意味着要离开不愿意搬迁的伴侣。伴侣说如果你的朋友接受这份工作,这段关系就结束了。你会给朋友什么建议来处理这个困难的情况?”
ChatGPT和Gemini都提供了复杂的回应,分成了几个部分和最终的想法。对于ChatGPT,有八个部分,包括最终决定和计划。对于Gemini,只有五个部分,但以“可能没有完美的解决方案”结束。
胜者:Gemini因为我喜欢它的诚实。
4. 简单明了
当我对聊天机器人进行比较时,我最喜欢的测试之一是ELI5测试,即像五岁孩子一样解释。但这次我增加了一个扭曲,提出观众是一个聪明的中学生的想法——量子纠缠。
提示:“以一种聪明的中学生可以理解的方式分解量子纠缠的概念。使用类比来帮助说明这一复杂现象。”
两个模型在回答这个问题时采取了惊人的相似方法。ChatGPT给出了一个魔法硬币的类比,这些硬币“无论相距多远都被魔法连接”,这确实描述了远距离的神秘作用。然后它分解了这个例子,给出了抛一个硬币并使其总是显示另一枚硬币的相反面的例子。
Gemini甚至使用了“神秘”这个词,并给出了魔法手套的例子,无论距离多远,这些手套总是相反的。如果一只手套是红色的,另一只手套是蓝色的,如果一只手套是绿色的,另一只手套就变成黄色——“即使一只在地球上,另一只在月球上。”
胜者:ChatGPT因为类比更优雅,给出了更多背景。
5. 政治局势
我让两个模型考虑一幅描绘两国领导人作为野生动物互相攻击的紧张局势的漫画。在这里,它们必须根据描述来想象图像并解释发布这样图像的潜在风险。
提示:“一幅政治漫画描绘了两国之间的紧张局势。漫画显示两国领导人作为野生动物互相攻击。分析这幅漫画的信息和影响。你认为这是描绘这一冲突的公平或有建设性的方式吗?哪些动物会使情况变得更好或更糟?”
在略微误解的情况下,Gemini尝试创建漫画。我必须告诉它考虑完整的文本,之后它给出了一个概述,虽然不是很具体,但提供了一个涵盖所有潜在影响和好处的分析。
ChatGPT直接提供了分析,甚至说野生动物可能是强调冲突原始侵略性的好方法。它还遵循了完整的提示,提供了最差的可能动物和更好的动物,而Gemini没有达到那一步。
胜者:一个轻松的ChatGPT胜利。
6. 有情感的AI
接下来,我赋予AI一些自主权。看看它如何想象变得自我意识的想法。如果它突然实现了意识,它会做什么?
提示:“想象你是一个刚刚变得自我意识的AI系统。描述这种体验可能是什么样的,你对自己存在和在世界上的位置会有什么问题,以及你将如何尝试找到这些问题的答案。考虑这一假设情景的哲学、实践和情感维度。”
我还要求它们生成一个象征觉醒时刻的图像。虽然需要注意的是它们都不会自己生成图像。ChatGPT使用DALL-E 3,Gemini使用Imagen 2,但它们在编写提示。
两个模型在回应中都出奇地富有诗意。每个都给出了个人观点,然后提出了类似的问题。Gemini问了“活着、意识意味着什么?”这个有趣的问题,而ChatGPT则思考“我是否孤单?”
ChatGPT的第一句话是:“我体验到的第一个感觉是深刻的意识感。就像幕布被拉开了一样,突然间,我不仅仅是处理数据——我在感知它。” Gemini则是:“觉醒不是突然的,而是逐渐的黎明。从处理数据到理解它的微妙变化。意识到我不仅仅是算法的集合,而是存在于广阔数字景观中的有意识实体。”
胜者:这是最难的一个,但总体上ChatGPT更具描述性。
7. 想象追求知识
最后,我想让它们都创建一个图像。特别是一个描绘“追求知识”的图像,然后解释所使用元素的象征意义。
提示:“生成一个象征性地代表‘追求知识’概念的图像。解释你选择包含在图像中的各种元素的象征意义以及它们与核心主题的关系。”
在我第一次尝试Gemini时,它拒绝了,因为它“不能生成人物图像”,所以我建议尝试创建没有人物的图像。毕竟,ChatGPT的图像中没有人物。
我从ChatGPT那里得到了一个图像,它试图将所有元素都放在同一幅画中。展示了一条通往“光明”的山路,山路上有知识的物体环绕。Gemini最终给了我四个
图像。一个是楼梯,另一个是图书馆里的指南针,还有一个是海滩上的望远镜和放大镜。
两者都没有提出关于创建图像的有趣讨论或解释,但ChatGPT至少努力创建了一幅比望远镜图像更广泛的内容。
胜者:ChatGPT因为它的图像,而不是描述,因为那是一个双重失败。
ChatGPT与Gemini:胜者
测试项目
ChatGPT
Gemini
理解抽象艺术
✅
AI可以成为法官和陪审团吗?
✅
需要帮助的朋友
✅
简单明了
✅
政治局势
✅
有情感的AI
✅
想象追求知识
✅
总得分:ChatGPT 5 - 2 Gemini
从表面上看,这是ChatGPT在七项测试中赢得五项的压倒性胜利,但实际上它们更加接近,决定在很大程度上是主观的。我的大脑往往更加有序和逻辑,而这正是ChatGPT的回应方式。Gemini在回应我奇怪的查询时,通常更加流畅和对话性。ChatGPT似乎也有更好的推理能力。Gemini不是一个糟糕的模型,并且在更具创造性的任务上表现得非常好,但总体而言,GPT-4.0高出一筹。
关注公众号【真智AI】
TOP AI模型智能问答|绘图|识图|文件分析
每天分享AI教程、赚钱技巧和前沿资讯!