44 lines
1.3 KiB
Markdown
44 lines
1.3 KiB
Markdown
# 渐进式查询策略
|
||
|
||
## 分层加载策略
|
||
|
||
问答时采用分层加载策略,节省 token:
|
||
|
||
1. **读取 project.md**:获取项目概述和文件索引(低 token 开销)
|
||
2. **判断相关文件**:根据用户问题和文件索引中的摘要,判断需要查阅哪些 parsed 文件
|
||
3. **按需加载**:读取相关 parsed 文件的全部或部分内容
|
||
4. **回答并标注来源**:基于获取的信息回答问题
|
||
|
||
## 来源引用格式
|
||
|
||
回答中引用具体信息时,使用以下格式标注来源:
|
||
|
||
```
|
||
根据《文件名》(parsed/文件名.md),...
|
||
```
|
||
|
||
多个来源时分别标注各信息点的来源文件。
|
||
|
||
## 无相关信息
|
||
|
||
当知识库中未找到与用户问题相关的信息时,明确告知用户,不编造答案。
|
||
|
||
## 空知识库
|
||
|
||
如果 project.md 文件索引为空(尚无已入库文件),应告知用户知识库为空,建议先使用 `/lyxy-kb-ingest` 入库文档。
|
||
|
||
## 依赖关系
|
||
|
||
| 依赖 | 用途 |
|
||
|------|------|
|
||
| lyxy-reader-office | 解析 .docx、.pdf、.pptx、.xlsx 文件为 markdown |
|
||
| lyxy-runner-python | 通过 uv 执行 lyxy-reader-office 的 Python 解析脚本 |
|
||
|
||
## 限制
|
||
|
||
- 不支持向量化语义搜索
|
||
- 不支持跨知识项目关联查询
|
||
- 不支持文档版本对比或 diff
|
||
- 不支持多用户协作或权限控制
|
||
- 大量文件全量重写时 token 消耗较高
|