使用豆包和扣子训练一个自己博客的智能助手
文章摘要
HeoGPT
这篇文章谈论了如何使用COZE和扣子(两者分别是字节的海外版和国内版AI机器人工具)。作者用pandoc把markdown文件批量转为txt文件,合并所有txt以降低知识库节点数量。他提到创建知识库和机器人,并关联这两者。但是指出扣子对知识库识别的能力有待提高。教程介绍了如何将机器人发布到豆包。
此内容根据文章生成,并经过人工审核,仅用于文章内容的解释与总结
投诉之前说过字节有COZE,但是是海外版的,接入的是GPT4可以无限用。国内版的COZE叫“扣子”。
看到林木木发的朋友圈才知道这个,我尝试用自己的文章来投喂训练一下,可惜最大的节点条目不能超过100条。不过我们可以把文章都合并成一个txt文件,这样就不受节点数量的限制了。
批量将markdown文件转换为txt文件
我这里使用的是pandoc。以mac为例(这个软件也支持windows,教程可以自行问gpt),安装pandoc
1 | brew install pandoc |
然后cd进文件夹,例如我的文件夹在/Users/zhheo/Downloads/_posts
那么我的命令为:
1 | cd /Users/zhheo/Downloads/_posts |
然后开始进行转换
1 | for file in *.md; do pandoc "$file" -o "${file%.md}.txt"; done |
稍微等待一会,md文件都转换成txt啦
合并所有txt文件
因为知识库的节点有上限,为100,所以我们合并所有的txt文件这样只消耗1个节点。
1 | pandoc *.txt -o combined.txt |
这样我们就可以获取到combined.txt
文件啦
创建知识库
我们可以创建一个知识库,起好名字
上传文档
我800篇文章也就3mb,所以绝大多数博客我感觉都可以一个文件搞定。
创建机器人
在个人空间我们创建一个机器人,然后填写一些信息。
写一些基础的prompt之后,我们点击优化。
然后关联我们的知识库
体验
在询问体验的时候,感觉对于知识库的识别不是很好。询问的时候很多不准确。同样的知识库在coze国际版的回答效果会更好。可能是因为国内使用的云雀语言模型的差异吧。
国际版可以给出知识库内容:
国内版就不可以:
发布到豆包
我们可以将已经创建好的机器人发布到豆包之中。
点击右上角发布按钮。
选择豆包。
点击发布即可。然后可以分享链接给其他人。
这里发一下林木木的豆包机器人。
https://doubao.com/bot/sTvq8rQq
总结
目前这个扣子的知识库识别能力还是非常有限。所以目前只作为试玩使用。大家也可以试一下云雀语言模型,感觉智能程度一般。不过因为能添加很多插件,倒是也有一些实用性。
- 感谢你赐予我前进的力量
打赏者名单
因为你们的支持让我意识到写文章的价值🙏
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 张洪Heo
评论
生成评论
匿名评论
违规举报
✅ 你无需删除空行,直接评论以获取最佳展示效果