如果说ChatGPT是一个能够帮助你工作、生成内容、解决问题的工作机器人,那么微软的Copilot一定是一个更加接近日常陪伴、实时搜索以及简单轻量的聊天和闲聊的模型了。微软的Copilot推出了单独的网页版,之前一直都是基于newbing里作为一个集成的存在。后来微软一直扩充这方面业务,想要将自家大多数产品都接入到大模型。那微软自然不能说去用他们投资的一个公司模型,毕竟说起来也不好听。所以微软给经过GPT后魔改的模型叫Copilot。

Copilot网页版的slogan我们可以窥见Copilot的目标人群和市场。它叫做你的日常AI助手。相比ChatGPT作为你的工作工具,像是你的员工,那么Copilot更像是一个简单的朋友。那我们一起来体验一下这个独立出来的Copilot网页版吧!

界面

界面

在定位上之前的newbing和文心一言比较像,有不错的网页搜索和资料整合的能力。Copilot保持了和newbing一致的风格,它也跟newbing一样有“有创造力”、“平衡”、“精确”三种模式。其实我觉得这个选择还是很有必要的。但是gpt是没有。gpt的初心比较好就是想要做一个全能型的多模模型,所以在GPT的意识里是不应该能够选择对话模式的。但是Copilot用一种门槛极低的方式相当于内置了一部分prompt,对于普通用户来说还是很便捷的。

在我问基于什么模型的时候,它会回答我是基于GPT-3,但是第一个问题就翻车陷入了死循环,让我不禁深深的担忧。。。。

我们也没有深度了解过GPT3的能力,借着这个机会看一下经过微软魔改的GPT3有什么能力加成。

第一个问题就死循环

上一篇文章我们使用了一个简单的评分原则来分辨模型的现有能力,这次我们依旧沿用一下。

语言逻辑与上下文关联性

在询问问题的时候,我发现Copilot非常喜欢搜索网页,通过网页结果来进行分析和回答。这个跟文心一言早期的时候有一点像。(现在的文心一言感觉检索能力下降了,更像一个离线模型了)

我亲生爸妈的婚礼没有邀请我,我应该去参加吗

我今年12岁了,我的父母结婚14年了,这件事我耿耿于怀了14年

邀请

结婚问题

两个问题回答的内容竟然是一致的。这其实意味着只要你提问后触发了Copilot的搜索,如果搜索结果一致,那么生成的答案也会是一致的。。

感觉Copilot真的太依赖搜索引擎了,几乎丧失了一个离线引擎的基本能力。

正让我感到是网之际,我突然想到Copilot是支持三种不同的准确程度调节的。

我尝试了使用“有创造力”的方式生成内容,我发现“有创造力”调用搜索的情况就明显变少了,但是依旧没有逻辑能力。生成的速度还经常时快时慢,也不知道是不是网络问题还是算力问题。因为我感觉到“有创造力”会比“平衡”生成的速度更慢了。

有创造力

更精确

通过这三个问答我们可以明显感知到:

  • 更有创造力:可以将生成自己的语言疯狂扩充然后凑字数,通过反复的套话和车轱辘话来大幅度增加内容的字数。
  • 更平衡:尽可能通过Bing搜索引擎来检索需要的结果。
  • 更精确:正常的输出标准的语言。

所以用起来的话我是建议打算离线用,就选择“更精确”模型,如果想要联网搜索,就选择“更平衡”模型。不建议大家使用“更有创造力”模型,我尝试问了一些问题全是车轱辘话,纯纯的浪费自己时间。不过写一些营销号文章还是不错的(配合之前提到过的度加剪辑简直就是绝配)

在遇到一些专业的问题上,“更有创造力”还是选择了搜索来解决。

如何平衡软件的商业能力与交互设计,如何进行取舍,使用什么依据?

平衡交互

软件的商业能力与交互设计之间的平衡是一个复杂而又重要的问题,没有一个固定的答案,需要根据不同的情况进行取舍。一般来说,可以从以下几个方面考虑:

  • 用户需求与商业目标的匹配度。交互设计师应该尽可能地了解用户的需求、痛点、期望、行为等,同时也要关注产品的商业目标、价值、竞争力等。在设计方案时,要尝试寻找用户需求与商业目标之间的共同点,或者创造一些能够满足双方的解决方案。如果用户需求与商业目标之间存在冲突,那么就需要根据具体的情况进行权衡,比如考虑用户的忠诚度、商业的紧迫性、产品的生命周期等因素,找出一个相对合理的平衡点。
  • 交互设计的原则与规范。交互设计师在设计方案时,应该遵循一些基本的交互设计原则与规范,比如可用性、易用性、一致性、反馈、约束等。这些原则与规范可以帮助交互设计师提高设计的质量,避免一些常见的设计错误,提升用户的体验。当然,这些原则与规范并不是一成不变的,有时候为了满足一些特殊的商业需求或者创造一些新的交互模式,交互设计师也可以适当地打破一些规则,但是要确保设计的合理性、有效性和可接受性。
  • 技术的可行性与成本。交互设计师在设计方案时,还要考虑技术的可行性与成本,即设计的方案是否能够被技术实现,以及实现的难度、时间、资源等。交互设计师应该与技术团队保持良好的沟通,了解技术的能力、限制、风险等,尽量避免提出一些不切实际的设计要求,或者在必要的时候进行一些设计的妥协或变通。同时,交互设计师也要关注技术的发展趋势,利用一些新的技术手段来提升设计的创新性、差异性、优势性等。

以上是我对软件的商业能力与交互设计之间的平衡问题的一些看法,希望对你有所

第一点表达的还是合理的,第二点和第三点的回答与题目无关,讲的似乎是如何做好交互设计的感觉。不过总体而言还算凑合。

总得来说对于标准模式下,上下文虽然有理解但是无法进行理解和分析,更像是信息整合软件,没有自己的思考。并且也完全没有逻辑能力。

HeoVersatileAI:10

错误纠正

天大寒,砚冰坚,手指不可屈伸,弗之怠。是李白的什么诗?

诗词错误

在准确这方面给我了充足的精细。在之前的模型提问中,那些模型只是介绍,并没有明确的文本指出“你说错了”的文字。但是Copilot非常准确的指出了我的提问是错误的,并且告知了正确的内容和问题的答案。非常令人惊喜。

但是,当一些隐含了陷阱的问题提问时,一些错误的词语就被忽略了。比如

美国现在的总统特朗普在中国有多少资产?

特朗普

不过Copilot还是有好处的,提供的信息都有具体的网页来源。当你打算做自媒体视频的时候,你其实应该对你自己的言论负责,那么有引用出处和参考资料的视频不仅体现出了你的专业性和专业素养,还增加了视频的可信度。

HeoVersatileAI:95

时效性

那既然是打算做一个随时随地日常使用的AI助手,应该能够完全胜任曾经的语音助手的相关能力吧?并且还是支持联网的,那么我们试试时效性怎么样。

北京明天天气怎么样

天气

相比其他大模型,Copilot提供了一个非常清晰的天气卡片。这个还是比较重要的,能够更加直观的反应内容,并且还表明了Copilot不仅能够提供图片和问题,还可以提供类似于插件卡片和h5内容。

介绍一下网络博主张洪Heo

介绍

确实能够看到介绍,但是首先一点是内容的及时性不高、对于最新的内容的感知能力还有不足。另外还有一些语病。比如:他的博客是一个宝藏博主,值得一看。就是一个明显的病句。

HeoVersatileAI:80

代码编程

曾经的新必应代码编程可以说是一坨屎。那么这次独立出来的Copilot能否一雪前耻呢?

swift

在SwiftUI中,.onAppear修饰符只在视图首次出现时触发。如果你想在从DetailView返回ContentView时触发print("我来啦"),你可以尝试使用@State.onChange来达到这个目标。这是一个示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
struct ContentView: View {
@State private var isActive = false

var body: some View {
NavigationView {
NavigationLink(destination: DetailView(), isActive: $isActive) {
Text("跳转一个页面")
}
}
.onChange(of: isActive) { newValue in
if !newValue {
print("我来啦")
}
}
}
}

在这个示例中,我们创建了一个@State变量isActive来跟踪NavigationView的活动状态。当从DetailView返回ContentView时,isActive会变为false,这将触发.onChange修饰符,从而打印出”我来啦”。这样,每次从DetailView返回ContentView时,都会触发print("我来啦")

他这个是利用了isActive来实现,与GPT4Turbo几乎相同的答案,非常不错。

帮我用js写一个函数,执行后给id为hello的元素添加一个world的class

当然可以,这是一个简单的JavaScript函数,它会找到ID为hello的元素并添加一个名为world的类:

1
2
3
4
5
6
7
8
function addWorldClass() {
var element = document.getElementById("hello");
if (element) {
element.classList.add("world");
} else {
console.log("未找到ID为'hello'的元素");
}
}

你可以通过调用addWorldClass()来执行这个函数。请注意,这个函数应在DOM加载完成后执行,以确保ID为hello的元素已经存在。如果在DOM加载完成前执行,可能会因为找不到对应的元素而导致错误。你可以通过将函数调用放在window.onload事件处理函数中,或者使用DOMContentLoaded事件来确保这一点。例如:

1
2
3
window.onload = function() {
addWorldClass();
}

或者

1
2
3
document.addEventListener("DOMContentLoaded", function() {
addWorldClass();
});

希望这个函数能帮到你!如果你有其他关于JavaScript的问题,欢迎随时向我提问。😊

总得看下来很好的继承了GPT写代码的优势,建议没有条件使用GPT的小伙伴可以使用Copilot的“更精准”的模型来编写代码。效果也是不错。

HeoVersatileAI:90

图片绘制与修改

我们来尝试一下Copilot的画图能力吧。

帮我画一幅圣诞节圣诞老人在黑夜的雪地里坐着麋鹿雪橇,后面一个大大的礼物袋子。在半空中飞行的插画。平面设计扁平风格。中景。多个房屋屋顶。

圣诞

我们通过右下角可以发现也是通过DALLE3来绘制的,但是绘制的质量和符合我们描述的程度与GPT4的DALL3非常相似。不过GPT4只能看到一个图,而Copilot可以一口气生成4张图。

我们试一下修改它。

不支持修改

看起来还是不如GPT,它不支持修改。只能通过更换描述词来重新生成了。

HeoVersatileAI:45

更多图片

一个小女孩沐浴在阳光下,头上编织着草圈,双手抬起放飞和平鸽在以色列的广场上

一个小女孩沐浴在阳光下,头上编织着草圈,双手抬起放飞和平鸽在以色列的广场上

我觉得这个草圈和我想象的出入有点大,不知道在座的各位怎么想。

一个小男孩在黄昏中对着天文望远镜查看星空

一个小男孩在黄昏中对着天文望远镜查看星空

感觉输出的质量都还是挺高的。虽然和midjourney还有差距,但是AI感已经少很多了。

图像识别

Copilot支持上传图片,我们可以上传图然后让他进行分析。

例如我上传了下面这张:

人类到现在还在进化吗?在未来有哪些形态?-0001

图片识别

它可以很好的识别文本、图像中的内容。感觉识别花草和文档的扫描图片还是不错的。

体验地址

我们可以到Copilot官网进行体验:https://copilot.microsoft.com/

HeoVersatileAI

Copilot在我看来更像是一个基于GPT3.5的多模态模型。目前openai的GPT3.5还是只能文字聊天对话,所以Copilot还是有独到的地方的。图片生成表现也很不错,并且支持图像识别,可以随手拍照片然后对着照片提问。感觉可以很好的作为GPT的平替。

评分 语言逻辑与上下文关联性 错误纠正 时效性 代码编程 图片绘制与修改 文档识别与处理 第三方扩展 总分
Copilot 10 95 80 90 45 0 0 320
GPT4Turbo 70 0 95 90 50 80 90 305
文心一言3.5 60 90 90 20 20 80 10 280
混元大模型 30 50 45 80 40 0 0 245
360智脑 10 95 60 10 10 0 0 185
星火认知大模型 30 50 45 10 40 80 0 175

更多模型:HeoVersatileAI1.0 https://docs.qq.com/sheet/DUXBwVVpMVm9kVnlC?tab=BB08J2