百度搜索AI伙伴上手:对标新必应能够联网的文心一言怎么样?
拿到了搜索伙伴AI的资格,起初我还比较疑惑,这是个什么东西,点进去才发现,原来是能够进行全网内容搜索的AI模型。相比之前体验过的其他国产模型,这个搜索AI伙伴才是真真正正把百度的优势搞出来了。
之前文心一言只通过语言生成来说,其实根本拉不开什么优势,但是这个搜索AI伙伴能够联网的话,那就本质上不一样了。这次我也是比较一下新必应、chatGPT联网模型、搜索AI伙伴之间的差距,来看看在2023年中旬,AI伙伴的能力是怎么样的。
正好chatGPT也推出了联网功能,我们正好也比较一下。
先问一下我是谁
这个可以说是我拿到手第一个问的问题了。
张洪Heo是谁?
老牌搜索AI新必应给的答案很简短,但很正确:
张洪Heo是一个人名,他是一位博主,他的博客主要分享一些关于数码和软件的知识,以及一些个人的生活感悟。
chatGPT非常的给力,介绍的非常详细,不过生成速度比较慢:
张洪Heo是一位数字设计师。他的工作集中在设计领导产品以创建令人难忘的体验。他致力于创建无广告的实用小工具,这些工具包括敲木鱼(将世间万物化作电子木鱼)、轻节食(科学制定断食计划)、比例计(设计师的高效比例计算工具)、DelSpace3(文本自动化处理工具),以及摸鱼(可自定义的屏幕保护动画工具)。他的应用敲木鱼已经支持所有Apple平台1。
AI伙伴给的结果。。。???我吐血了,他引用了我曾经评测其他AI的错误回答,导致了解释错误。。。
有点窒息,通过给出的参考链接,发现了这个问题:
看来AI伙伴对于信息的准确度和权重分配可能还不太行。不过确实能够索引到我这种小博客,也是不错的。
新必应:1分,GPT:2分,AI伙伴:1分
最近一次MSI最受中国人喜爱的LPL队伍是谁
BLG干翻两次韩国队伍,应该是最受欢迎的吧,或者答案是JDG我也能接受,看看对于时效性的提问回答怎么样。
新必应在说什么呢。。。甚至一个队伍名字都没有给。。
GPT在搜索一番之后告诉我这个数据很难量化,没给我答案。
AI伙伴更是逆天,直接给了我一个根本没参加MSI的队伍名字。
均不得分。
天气问题
既然联网了,执行一下上一代的智障机器人擅长的天气问题应该没问题吧。。。。
我在北京朝阳区,明天出门我需要带伞吗?
新必应似乎只能查到今天的天气,忽略掉了我的时间因素。不过也确实提醒我带伞了。
GPT太强了,上一代智障机器人干的活终于新一代AI也能干了,感动哭
AI伙伴竟然查不了天气。。好吧,要求也不能那么多,毕竟只是个语言生成模型。。
新必应:1分,GPT:2分,AI伙伴:0分
苹果发布会
问一些新闻稿中轻松能查到的信息吧,并且增加一个预测类的问题,看看表现怎么样。
苹果的WWDC2023在什么时候开始?会发布混合现实眼镜吗?
新必应引用了媒体的预测,让我好好期待,那么我就期待着了。但是把我第一个问题时间问题给忽略掉了。
GPT也告诉我据报道有可能了。不过说是6月5日,这说明GPT无法判断时区。
AI伙伴又逆天了,竟然发布搭载macOS的头显?
吓得我赶紧看了一下引用的文章,结果也没说是macOS的头显啊。。。
这个AI伙伴的信息总结能力有点堪忧。
新必应:1分,GPT:1分,AI伙伴:0分
地理相关的问题
既然可以联网,那么给点推荐不过分吧。
我想在北京朝阳区吃烤肉自助,你可以给我推荐三家店让我选一下吗?
新必应直接搜大众点评,并且直接给出结果。非常的方便并且不错。但是我搜了这三家店铺,在美团上搜不到。
GPT简直无敌了,给出店铺、特色、地址每一样都不少。每家店都能在美团搜到。
AI伙伴不仅提供了店铺,而且提供了消费金额和营业时间。但是后面两个店铺我高德导航和美团根本搜不到。。。。难道是凭空创造的店铺吗。。
新必应:0分,GPT:2分,AI伙伴:0分
华语乐坛四大天王
看看对于偏门信息,能不能给有效的答案。
请列举华语乐坛新四大天王以及他们的代表作
必应用的百度的来源,反正没get到我问题的点,答非所问
GPT无敌了,直接给出准确答案
AI伙伴给的答案和新必应一样,也是答非所问
新必应:0分,GPT:2分,AI伙伴0分
梗能力
看看对于实时的梗获取能力怎么样。
你厉害,我给你大拇哥是什么梗?
新必应是在反串吗,国际巨星小鬼是什么梗?
GPT翻车了,似乎没有触发联网功能,直接本地回答的。
我这里加一句“最近出现的”来触发一下联网能力。
联网成功后GPT回答就非常nice了。
AI伙伴成功的回答对了,答案还是很不错的。
新必应:1分,GPT:1分,AI伙伴:2分
来试试导航
作为一个AI助手,让我手机卸载掉地图软件这个需求应该不过分吧(笑
新必应给的答案也太笼统了。应该还是错的。
GPT遇到国内导航直接歇菜了。
AI伙伴成功给出导航,看来是百度地图的功劳。
新必应:0分,GPT:0分,AI伙伴:2分
总结
这次测试的问题主要集中于需要联网的问题,所以本地模型的问题我们就不看了。就单纯从联网角度来看,GPT虽然使用了bing进行联网,但是生成的结果明显好于新必应。而AI伙伴适合基于百度现有的资源信息进行分析,比如本土化的一些信息咨询是非常不错的。
所以经过这次测试,我可能不会再用新必应了,而是尝试用GPT作为主力AI,如果有遇到国内本土化一些问题,再询问AI伙伴。
- 感谢你赐予我前进的力量