之前说过字节有COZE,但是是海外版的,接入的是GPT4可以无限用。国内版的COZE叫“扣子”。

扣子

看到林木木发的朋友圈才知道这个,我尝试用自己的文章来投喂训练一下,可惜最大的节点条目不能超过100条。不过我们可以把文章都合并成一个txt文件,这样就不受节点数量的限制了。

批量将markdown文件转换为txt文件

我这里使用的是pandoc。以mac为例(这个软件也支持windows,教程可以自行问gpt),安装pandoc

1
brew install pandoc

然后cd进文件夹,例如我的文件夹在/Users/zhheo/Downloads/_posts那么我的命令为:

1
cd /Users/zhheo/Downloads/_posts

然后开始进行转换

1
for file in *.md; do pandoc "$file" -o "${file%.md}.txt"; done

稍微等待一会,md文件都转换成txt啦

合并所有txt文件

因为知识库的节点有上限,为100,所以我们合并所有的txt文件这样只消耗1个节点。

1
pandoc *.txt -o combined.txt

这样我们就可以获取到combined.txt文件啦

创建知识库

我们可以创建一个知识库,起好名字

进入知识库

上传文档

上传文档

我800篇文章也就3mb,所以绝大多数博客我感觉都可以一个文件搞定。

创建机器人

在个人空间我们创建一个机器人,然后填写一些信息。

创建机器人

写一些基础的prompt之后,我们点击优化。

优化prompt

然后关联我们的知识库

关联知识库

体验

在询问体验的时候,感觉对于知识库的识别不是很好。询问的时候很多不准确。同样的知识库在coze国际版的回答效果会更好。可能是因为国内使用的云雀语言模型的差异吧。

国际版可以给出知识库内容:

国际版

国内版就不可以:

国内版

发布到豆包

我们可以将已经创建好的机器人发布到豆包之中。

点击右上角发布按钮。

发布

选择豆包。

豆包

点击发布即可。然后可以分享链接给其他人。

这里发一下林木木的豆包机器人。

https://doubao.com/bot/sTvq8rQq

总结

目前这个扣子的知识库识别能力还是非常有限。所以目前只作为试玩使用。大家也可以试一下云雀语言模型,感觉智能程度一般。不过因为能添加很多插件,倒是也有一些实用性。