最近在使用obsidian+Copilot虽然使用确实不错,但是总感觉差点味道。 今天试了试python搞得rag向量数据库+ai模型,跑起来还是不错,但感觉和obsidian+Copilot大差不差。但至于差在哪里,却一眼难尽。单篇文章分析,都是可以的。多文章分析就报废了。 所以有个思路 针对md文档必须有严格的限制,在此使用markdown文章的yaml标签案例。 例如 ``` --- 标题: git拆分分支和合并分支 日期: 2025-09-24 作者: Del Levin 分类: - 技术笔记 - 其他 tags: - 技术笔记 - git - 运维 - windows --- ``` 构建数据库->检索 结构化检索方式:指定统计方式,分析方式 非结构化检索方式:ai分析 检索方式: 分类词:{classification[分类词1,分类词2]} 标签 :{tags[标签1,标签2]} 指定文章:{title[文章名称1,文章名称2]} 提问方式为: 1.根据{classification[分类词1,分类词2]}分类总结一下我这个人 2.根据{tags[标签1,标签2]}标签总结一下我的技术栈 3.{title[文章名称1,文章名称2]}总结一下这两篇文章 4.{title[文章名称1]}总结一下这一篇文章 理想很美好,现实很骨感,知识库的容量参考文件不支持那么多。要想真正实现,只能拿自己的笔记进行模型训练。可是模型数据基 数不足,成为一个问题。我也不知道该怎么做了。。。。 Loading... 最近在使用obsidian+Copilot虽然使用确实不错,但是总感觉差点味道。 今天试了试python搞得rag向量数据库+ai模型,跑起来还是不错,但感觉和obsidian+Copilot大差不差。但至于差在哪里,却一眼难尽。单篇文章分析,都是可以的。多文章分析就报废了。 所以有个思路 针对md文档必须有严格的限制,在此使用markdown文章的yaml标签案例。 例如 ``` --- 标题: git拆分分支和合并分支 日期: 2025-09-24 作者: Del Levin 分类: - 技术笔记 - 其他 tags: - 技术笔记 - git - 运维 - windows --- ``` 构建数据库->检索 结构化检索方式:指定统计方式,分析方式 非结构化检索方式:ai分析 检索方式: 分类词:{classification[分类词1,分类词2]} 标签 :{tags[标签1,标签2]} 指定文章:{title[文章名称1,文章名称2]} 提问方式为: 1.根据{classification[分类词1,分类词2]}分类总结一下我这个人 2.根据{tags[标签1,标签2]}标签总结一下我的技术栈 3.{title[文章名称1,文章名称2]}总结一下这两篇文章 4.{title[文章名称1]}总结一下这一篇文章 理想很美好,现实很骨感,知识库的容量参考文件不支持那么多。要想真正实现,只能拿自己的笔记进行模型训练。可是模型数据基 数不足,成为一个问题。我也不知道该怎么做了。。。。 最后修改:2025 年 10 月 13 日 © 允许规范转载 打赏 赞赏作者 支付宝微信 赞 如果觉得我的文章对你有用,请随意赞赏