不知道大伙儿有没有觉得,自打这 ChatGPT 问世之后。除了上新过联网功能之外,好像就没啥大的更新了?
跟风平浪静的 ChatGPT 比起来,其他的 AI 大模型反倒花样百出、争奇斗艳。
前 OpenAI 的员工搞的 Claude ,不仅上新了文档上传功能,据说编码、数学和推理方面都有了不小的提升。
当年一直被人吐槽起步慢的谷歌 Bard ,干脆抢先上线了图片分析功能。
这个狠活, ChatGPT 可是到现在都不支持。
各家这么铆足劲,是想抢了 ChatGPT 老大哥的位置了啊。
那有这种热闹怎么能少得了咱呢,模型一更新,就赶紧上手试了试。
这回谷歌的 Bard ,除了图像分析功能之外,终于支持中文了。
咱们就先从中文体验上手,当个开胃小菜。
先整点儿经典的,让 Bard 解释 “ 我去 ” 的意思。
你别说, Bard 还真能 Get 到这里边儿的精髓。再比如 “ 我一把把把手把住了 ”、“ 我差点没上上上上海的车 ” 这两句,第一眼看了估计都得捋一捋才能明白。
但 Bard 不仅能在几秒钟内给你解释清楚,还列举了一些使用场景。
说真的,测到这的时候我就已经想给 Bard 颁“ 中文十级 ”的证书了,而且像“ 龘 ”这种生僻字,也不在话下。
甚至连一些方言,它都学会了。
不得不说, Bard 这次的更新确实给力,词义理解和句子逻辑都没啥毛病,估计背地里早就已经偷摸把中国人日常的说话习惯给琢磨得透透的了。
看来,世超还是小瞧了这 Bard 的中文水平,是时候该上点难度了!
我找了个不少人可能都会搞混的成语:望其项背 。
意思是形容差距很小,但很容易跟“望尘莫及”混淆,反被人理解成差得很远,难以追上。
结果,还真翻车了。
感觉 Bard 在成语理解上还差点儿意思,于是世超又换了诗歌的考题。
让它用 “ 差评八周年 ” 写一首藏头诗,结果它直接给我干沉默了。
你别说,你还真别说。虽然诗写得就像依托答辩,但解释得还挺像那么回事儿。
测试下来,觉得可以用一句话总结这次 Bard 的中文更新:挺厉害的,但不多。
不过,有一说一,这次给 Bard 的问题还是上了强度的,连人都不一定能做对的题,让一个 AI 来,可能着实是有点为难它了。
测完中文能力之后,就到了世超这回最期待的图片输入和输出功能。
稍微有点遗憾的是,图片功能目前只支持英文。
如果想要体验,需要把谷歌账户语言设置为英语,才能上传图片。
我随手在纸上整了几下鬼画符,就丢给 Bard,让它把这几个字符变成一个精美的网页。
面对如此粗暴的甲方要求, Bard 几秒钟就整完了。
不仅明白了我的需求,甚至还给我简陋至极的页面美化了一下,增加了密码输入和登录按钮。
不仅是能精准地解读图片,甚至有些经典图,它还能给你唠上两句。
比如,我试了一道当年的互联网热图,想看看在 AI 眼里的这条裙子,到底是白金还是蓝黑。
Bard 一眼就看穿了我的心思,不光回答出裙子是蓝黑色,还讲解了一下原因和裙子爆红的历史。
虽然但是,还是觉得这是裙子是白金色:
跟狠货满满的 Bard 比起来, Claude 的更新就有点对不起 “ ChatGPT 的最强杀手 ” 的头衔。
Claude 说自己输入内容达到了 100k ,甚至能支持上传一整本书,代码和逻辑能力也是突飞猛进。
原本就很强的中文,确实是越来越精进了,甚至怀疑 Claude 有专门针对中文语料进行训练。
经典的脑筋急转弯,它都能条理清晰地拆解和分析。
用起网络流行词也是信手拈来,居然连“ 真香! ”都知道。
这回上新的文档上传功能,分析速度也很快,抓取总结得挺到位的。
试着上传了一篇接近五千多字的文章,半分钟不到就提炼出来了。
稍微美中不足的是不支持上传在线文档。
看到这,你可能觉得 Claude 这不挺强的嘛。
别急,中文一直是它的强项,但是数学逻辑题,现在还是不太行。
鸡兔同笼问题是问一道,中招一道。现在大模型做这种题型,基本没人会错了吧。
简单的代码,确实难不倒 Claude 。但是,让它跟 GPT-4 一样做个贪吃蛇游戏出来, Claude 只会说:很感谢您的题目,但很遗憾,我做不到。
而且,你每多提一个要求, Claude 就会忘记一个上次的要求。记得给输入框做圆角,就会忘记做相加的效果。
这样的长对话能力,着实有点堪忧。
最后总得来说,这次除了 Bard 的图片功能之外,这两位“ OpenAI 杀手 ”其他的更新,并没让人感觉到炸裂。
毕竟,被大家吐槽了惯了大模型“ 幻觉 ”,还有弱鸡的数理能力,依旧没有被解决。
在另一方面,或许是被炸麻了,当然也有可能是大模型的更新和体验,真的是越来越同质化了。
反正市面上几十个大模型,真的体验起来就一个样的既视感。
在大家卷了一轮又一轮之后,要想勾起大家的兴趣,可能还真得拿出些新鲜玩意才行。