
别做无用功!搭建AI知识库,读这一篇就够了
搭 AI 知识库:读这篇就够了
自 2022年11月底 ChatGPT 出现,很多朋友想到的第一应用场景:打造AI助理,作为人的第二大脑。
经过两年多发展,竟然没有任何软件达到。
不过也出现了RAG等技术,也依然涌现了一批知识库产品。
RAG (Retrieval-Augmented Generation) 是一种结合检索和生成的AI技术架构。
讲讲,个人觉得还不错的知识库产品。
NotebookLM
除了大模型 Gemini,NotebookLM是谷歌这两年出的最好的 AI 产品,没有之一。
用法很简单。
只需把TXT、PDF或Markdown格式文件上传,以后就能任意提问。
比如,我把自己这三年写日志,合并成一个Markdown文件,就可以任意检索提问。
比如问去年的今天,我写了什么。
比如当 AI 读了我的所有日志,它就能知道我有什么习惯。
只要有知识库,就能让厉害的人当你的智囊团。
比如,上传万维纲精英日课1-5季PDF,随时向“AI 万老师”提问。
推荐得到App订阅 1-6季,以上为举例示意。
再比如,把张一鸣微博PDF传上去,随时问公司管理问题。
另一个场景案例:快速总结会议纪要
有人会说,腾讯会议、飞书会议、通义听悟都支持AI做会议总结,为什么非要用NotebookLM呢?
实际对比测试,你就会知道,NotebookLM质量最好。
你可以提问,它也会推荐问题。
通过问题把内容串起来,这样的总结才是大家关心的、有信息量的。
ima.copilot 腾讯智能工作台
腾讯出品,有Win、Mac、微信小程序、安卓等多平台版本。(iOS还没上架)
官网地址:https://ima.qq.com/
LLM 模型使用的自家的混元和DeepSeek R1。
最大优势:和微信生态打通,比如微信小程序版支持导入微群聊中的PDF作为知识库,检索可以用微信订阅号资源。
可惜知识库空间不大,只有 1G 空间,且文档要传到云端做embedding处理,如果涉密资料,谨慎使用。
Mac电脑版:
微信小程序版
Get 笔记
得到出品,官网介绍:一款 AI 驱动的知识管理软件。
强大之处:
- 支持公开文章和网站的抓取总结(比如公众号)
- 支持抖音、B站、得到等网站的视频总结
你敢想象?一个学习软件支持抖音内容总结。
没想到前几天见一个做直播自媒体的朋友,见到这个App,两眼放光。
他们说经常要下载导出抖音中的文本,研究别人的话术。
没想到这个App,只需要粘贴链接就可以,而且还是免费的。
Cherry Studio 知识库
前段时间,Deepseek火爆,但官网不稳定。
很多人找好用的 AI 客户端,Cherry Studio就是个中翘楚,完全开源免费。
它不仅能跟 AI 对话,还支持搭建本地 embedding 知识库。
如图所示,对话时,可勾选是否启用本地知识库检索。
好处,数据在本地,远程调用embedding模型,在本地生成。
支持大量文件格式,比如很少软件支持的Epub电子书。
缺点,别传太多东西,容易卡住,另外需要注册申请账号使用 embedding 模型,对普通人来说稍微有点难,后续单独出教程。
Obsidian + Copilot插件
Obsidian是目前最流行的开源笔记软件之一,可以自己完全掌握数据。
插件生态丰富,其中一款国人开发的插件Copilot,获得2024年大奖。
安装这个插件并配置后,可实现本地笔记知识库。
支持本地LLM模型和云端模型,本地知识库Embedding后,检索回复特别细致、有效。
缺点,配置复杂!
来,感受下这个插件的灵活度和复杂度。
AI 编程工具如 Cursor、Trae、VS + Cline(Roo Code)
第一反应,这是啥!啥!啥?
AI编程工具都具备一个能力:检索大量文本文件,并交给 LLM 生成回复。
如果把代码换成知识类文本文件。
那它就能变身成为知识库工具。
随着AI Agent 在这类编程工具中落地,甚至可实现更复杂的查询和生成任务,远超传统知识库。
比如我在 VS 里装了Roo Code插件,里面又安装了几个笔记 MCP 服务。
我就能一句话查询Apple Notes中的笔记数据。
这种玩法问题:耗费LLM Token,配置复杂,有点杀鸡用牛刀的感觉。
后记 & 说明
以上是个人觉得有趣的知识库软件,电脑端最推荐 NotebookLM、手机端推荐Get笔记、小程序推荐ima.copilot。
限于篇幅,本篇只是常见AI 知识库工具的简单介绍。
如果大家对哪个工具感兴趣,欢迎留言,后续写针对性教程。