构建AI个人知识库的一些思考

2025 年 09 月 25 日

355 次浏览

736字数

最近在使用obsidian+Copilot虽然使用确实不错，但是总感觉差点味道。

今天试了试python搞得rag向量数据库+ai模型，跑起来还是不错，但感觉和obsidian+Copilot大差不差。但至于差在哪里，却一眼难尽。单篇文章分析，都是可以的。多文章分析就报废了。

所以有个思路

针对md文档必须有严格的限制，在此使用markdown文章的yaml标签案例。

例如

---
标题: git拆分分支和合并分支
日期: 2025-09-24
作者: Del Levin
分类:
  - 技术笔记
  - 其他
tags:
  - 技术笔记
  - git
  - 运维
  - windows
---

构建数据库->检索

结构化检索方式：指定统计方式，分析方式

非结构化检索方式：ai分析

检索方式：

分类词：{classification[分类词1,分类词2]}
标签：{tags[标签1,标签2]}
指定文章：{title[文章名称1，文章名称2]}

提问方式为：

1.根据{classification[分类词1,分类词2]}分类总结一下我这个人
2.根据{tags[标签1,标签2]}标签总结一下我的技术栈
3.{title[文章名称1，文章名称2]}总结一下这两篇文章
4.{title[文章名称1]}总结一下这一篇文章

理想很美好，现实很骨感，知识库的容量参考文件不支持那么多。要想真正实现，只能拿自己的笔记进行模型训练。可是模型数据基
数不足，成为一个问题。我也不知道该怎么做了。。。。