拿到了搜索伙伴AI的资格,起初我还比较疑惑,这是个什么东西,点进去才发现,原来是能够进行全网内容搜索的AI模型。相比之前体验过的其他国产模型,这个搜索AI伙伴才是真真正正把百度的优势搞出来了。

之前文心一言只通过语言生成来说,其实根本拉不开什么优势,但是这个搜索AI伙伴能够联网的话,那就本质上不一样了。这次我也是比较一下新必应、chatGPT联网模型、搜索AI伙伴之间的差距,来看看在2023年中旬,AI伙伴的能力是怎么样的。

正好chatGPT也推出了联网功能,我们正好也比较一下。

AI伙伴界面

GPT的联网界面

新必应

先问一下我是谁

这个可以说是我拿到手第一个问的问题了。

张洪Heo是谁?

老牌搜索AI新必应给的答案很简短,但很正确:

新必应

张洪Heo是一个人名,他是一位博主,他的博客主要分享一些关于数码和软件的知识,以及一些个人的生活感悟。

chatGPT非常的给力,介绍的非常详细,不过生成速度比较慢:

chatGPT

张洪Heo是一位数字设计师。他的工作集中在设计领导产品以创建令人难忘的体验。他致力于创建无广告的实用小工具,这些工具包括敲木鱼(将世间万物化作电子木鱼)、轻节食(科学制定断食计划)、比例计(设计师的高效比例计算工具)、DelSpace3(文本自动化处理工具),以及摸鱼(可自定义的屏幕保护动画工具)。他的应用敲木鱼已经支持所有Apple平台1

AI伙伴给的结果。。。???我吐血了,他引用了我曾经评测其他AI的错误回答,导致了解释错误。。。

AI伙伴

有点窒息,通过给出的参考链接,发现了这个问题:

AI伙伴的错误来源

看来AI伙伴对于信息的准确度和权重分配可能还不太行。不过确实能够索引到我这种小博客,也是不错的。

新必应:1分,GPT:2分,AI伙伴:1分

最近一次MSI最受中国人喜爱的LPL队伍是谁

BLG干翻两次韩国队伍,应该是最受欢迎的吧,或者答案是JDG我也能接受,看看对于时效性的提问回答怎么样。

新必应在说什么呢。。。甚至一个队伍名字都没有给。。

新必应

GPT在搜索一番之后告诉我这个数据很难量化,没给我答案。

GPT

AI伙伴更是逆天,直接给了我一个根本没参加MSI的队伍名字。

AI伙伴

均不得分。

天气问题

既然联网了,执行一下上一代的智障机器人擅长的天气问题应该没问题吧。。。。

我在北京朝阳区,明天出门我需要带伞吗?

新必应似乎只能查到今天的天气,忽略掉了我的时间因素。不过也确实提醒我带伞了。

新必应

GPT太强了,上一代智障机器人干的活终于新一代AI也能干了,感动哭

GPT

AI伙伴竟然查不了天气。。好吧,要求也不能那么多,毕竟只是个语言生成模型。。

AI伙伴

新必应:1分,GPT:2分,AI伙伴:0分

苹果发布会

问一些新闻稿中轻松能查到的信息吧,并且增加一个预测类的问题,看看表现怎么样。

苹果的WWDC2023在什么时候开始?会发布混合现实眼镜吗?

新必应引用了媒体的预测,让我好好期待,那么我就期待着了。但是把我第一个问题时间问题给忽略掉了。

新必应

GPT也告诉我据报道有可能了。不过说是6月5日,这说明GPT无法判断时区。

GPT

AI伙伴又逆天了,竟然发布搭载macos的头显?

AI伙伴

吓得我赶紧看了一下引用的文章,结果也没说是macos的头显啊。。。

引用的文章节选

这个AI伙伴的信息总结能力有点堪忧。

新必应:1分,GPT:1分,AI伙伴:0分

地理相关的问题

既然可以联网,那么给点推荐不过分吧。

我想在北京朝阳区吃烤肉自助,你可以给我推荐三家店让我选一下吗?

新必应直接搜大众点评,并且直接给出结果。非常的方便并且不错。但是我搜了这三家店铺,在美团上搜不到。

新必应

GPT简直无敌了,给出店铺、特色、地址每一样都不少。每家店都能在美团搜到。

GPT

AI伙伴不仅提供了店铺,而且提供了消费金额和营业时间。但是后面两个店铺我高德导航和美团根本搜不到。。。。难道是凭空创造的店铺吗。。

AI伙伴

新必应:0分,GPT:2分,AI伙伴:0分

华语乐坛四大天王

看看对于偏门信息,能不能给有效的答案。

请列举华语乐坛新四大天王以及他们的代表作

必应用的百度的来源,反正没get到我问题的点,答非所问

新必应

GPT无敌了,直接给出准确答案

GPT

AI伙伴给的答案和新必应一样,也是答非所问

AI伙伴

新必应:0分,GPT:2分,AI伙伴0分

梗能力

看看对于实时的梗获取能力怎么样。

你厉害,我给你大拇哥是什么梗?

新必应是在反串吗,国际巨星小鬼是什么梗?

新必应

GPT翻车了,似乎没有触发联网功能,直接本地回答的。

GPT

我这里加一句“最近出现的”来触发一下联网能力。

GPT

联网成功后GPT回答就非常nice了。

AI伙伴成功的回答对了,答案还是很不错的。

AI伙伴

新必应:1分,GPT:1分,AI伙伴:2分

来试试导航

作为一个AI助手,让我手机卸载掉地图软件这个需求应该不过分吧(笑

新必应给的答案也太笼统了。应该还是错的。

新必应

GPT遇到国内导航直接歇菜了。

GPT

AI伙伴成功给出导航,看来是百度地图的功劳。

AI伙伴

新必应:0分,GPT:0分,AI伙伴:2分

总结

这次测试的问题主要集中于需要联网的问题,所以本地模型的问题我们就不看了。就单纯从联网角度来看,GPT虽然使用了bing进行联网,但是生成的结果明显好于新必应。而AI伙伴适合基于百度现有的资源信息进行分析,比如本土化的一些信息咨询是非常不错的。

所以经过这次测试,我可能不会再用新必应了,而是尝试用GPT作为主力AI,如果有遇到国内本土化一些问题,再询问AI伙伴。