最近在使用obsidian+Copilot虽然使用确实不错,但是总感觉差点味道。
今天试了试python搞得rag向量数据库+ai模型,跑起来还是不错,但感觉和obsidian+Copilot大差不差。但至于差在哪里,却一眼难尽。单篇文章分析,都是可以的。多文章分析就报废了。
所以有个思路
针对md文档必须有严格的限制,在此使用markdown文章的yaml标签案例。
例如
---
标题: git拆分分支和合并分支
日期: 2025-09-24
作者: Del Levin
分类:
- 技术笔记
- 其他
tags:
- 技术笔记
- git
- 运维
- windows
---
构建数据库->检索
结构化检索方式:指定统计方式,分析方式
非结构化检索方式:ai分析
检索方式:
分类词:{classification[分类词1,分类词2]}
标签 :{tags[标签1,标签2]}
指定文章:{title[文章名称1,文章名称2]}
提问方式为:
1.根据{classification[分类词1,分类词2]}分类总结一下我这个人
2.根据{tags[标签1,标签2]}标签总结一下我的技术栈
3.{title[文章名称1,文章名称2]}总结一下这两篇文章
4.{title[文章名称1]}总结一下这一篇文章
理想很美好,现实很骨感,知识库的容量参考文件不支持那么多。要想真正实现,只能拿自己的笔记进行模型训练。可是模型数据基
数不足,成为一个问题。我也不知道该怎么做了。。。。
