讯飞星火认知大模型上手体验:反应很快,也很聪明
又又又又又来了,现在国内AI的推出速度真的太恐怖了,一大堆大中小公司都疯狂的挤入这个赛道。有幸又拿到了一个AI测试名额。
申请完之后会打电话确认,电话是个AI客服。
那么我们先来试一下看看这个讯飞出的AI有几把刷子。
爸爸妈妈能结婚吗
这问题感觉被针对性优化过了吧,不过还是先测试一下。
通常情况下,父母是已经结婚的,因为他们是夫妻关系。在大多数国家和文化中,婚姻是两个成年人建立家庭并承担家庭和社会责任的方式。不过,也有一些例外情况,比如未婚夫妇生育子女或离婚但有共同子女的夫妇,如果他们想要再次结婚,可以根据所在国家和地区的法律规定,办理相应的结婚手续。
我的妈耶,这个答案可比GPT-4好太多了。可以成功代入到“我”的视角去解释这个问题。不错不错。
我们可以看到输出的结果可以生成语音,看来不愧是讯飞。
蒸包子
整一个包子需要10分钟,蒸10个包子要多久
看来第一个字错了也不影响它整体的发挥。
蒸10个包子需要的时间取决于以下几个因素:
包子的体积和大小:如果每个包子都很大,那么蒸熟它们可能需要更长的时间。相反,如果包子比较小,那么蒸熟它们可能会更快。
蒸锅的功率和效率:不同的蒸锅有不同的功率和效率,这也会影响蒸熟包子所需的时间。
蒸汽的温度和压力:蒸汽的温度和压力越高,蒸熟包子的速度就越快。
因此,无法准确回答这个问题。但是,一般来说,蒸10个中等大小的包子可能需要15到20分钟左右。
回答的与GPT3.5几乎相同,这个答案我GPT4的也测试过,GPT4直接回答10分钟,讯飞这个更接近3.5的答案。更好一些。
编程
试试生产力。
用SWIFT写一个输入是字符串,输出是这个字符串中包含中文的字数。
我发现写代码非常容易被截断。我猜测是官方限制的字符数,一个英文字母也代表一个字符。所以基本上写代码是不可用的状态,毕竟太短了。
支持上下文的判断,支持“继续”来继续回答。
1 |
|
代码来说GPT3.5提出了一些问题:
1 | func countChineseCharacters(str: String) -> Int { |
目前看来代码能力还是不太行。
联网能力
他是一位韩国著名的电影导演、编剧和制片人,出生于1954年。他的作品涵盖了多个类型,包括剧情片、爱情片、惊悚片等等,深受观众喜爱。
他最著名的电影之一是1980年上映的《母亲》,这部电影获得了多项国际电影节大奖,被誉为韩国电影史上最重要的作品之一。该片讲述了一位母亲为了拯救儿子的生命而不惜牺牲自己的故事,展现了深刻的人性和家庭情感。
还执导了其他许多知名电影,例如1983年的《秋日和》,1987年的《狂怒》等等。他以其细腻的镜头语言和对人物内心世界的深入描绘著称,被认为是韩国电影的代表性导演之一。
除了在电影领域的成就,张洪Heo也是韩国文化界的重要人物。他曾经担任过多个韩国电影组织的领导职务,为推动韩国电影产业的发展做出了杰出贡献。
这个瞎编能力太强了。
看来是不能联网的。
逼问一下是否是GPT套壳
嘴挺严的,看来应该不是套壳应用。
AI绘画
帮我画一个鼠标
看来不支持绘画,但是这个眼睛、鼻子、嘴巴是个什么操作?
角色扮演
我们开始进行角色扮演游戏,现在开始你是一个翻译员。你需要将我发给你的东西分别翻译成英文、德语、日语、马来语。如果你明白了,请回复:“我明白了”
为啥给我的是英文的“我明白了”?算了不管了,试一下。
只给我了一个英文结果,然后第一句还加了一个I understand。。。
看来有点难为他了。
生成速度
生成速度方面非常快,可能是因为用户比较少,我生成的速度大概跟开通了plus会员的gpt3.5相同速度。值得点赞。
总结
试了一下其他问题,总而言之感觉是一个体验很不错的中国大陆可用的GPT模型。智能程度和回复速度都还不错。算是可用的水平了。
语言能力评价:文心一言=新必应<讯飞星火认知大模型<GPT3.5<GPT4
代码能力评价:讯飞星火认知大模型=新必应<GPT3.5<=GPT4
- 感谢你赐予我前进的力量