1
0

新增docx解析

This commit is contained in:
2026-02-12 16:23:23 +08:00
parent 004ebe3d4f
commit 53707efaf0
7 changed files with 703 additions and 0 deletions

View File

@@ -0,0 +1,27 @@
## 1. 准备工作
- [x] 1.1 研究现有 skill 定义格式,查看 `skills/` 目录下的其他 skill 示例(如 `python-runner``js-runner`)了解标准结构
- [x] 1.2 阅读 `skills/docx-reader/docx_parser.md` 了解解析脚本的详细功能和使用方式
## 2. 创建 skill 定义文件
- [x] 2.1 创建 `skills/docx-reader/skill.md` 文件
- [x] 2.2 编写 skill 的 description 字段,描述该 skill 的用途和定位(优先解析 docx 文档)
- [x] 2.3 编写 skill 的 capabilities 字段,列出所有支持的解析功能:
- 全文转换为 Markdown
- 获取文档元信息(字数、行数)
- 标题列表提取
- 指定章节内容提取
- 正则表达式搜索
- [x] 2.4 编写 skill 的 Compatibility 字段,声明 Python 3.6+ 和依赖库要求markitdown 或 python-docx 至少安装其一)
- [x] 2.5 编写 skill 的 Triggers 字段,包含中文和英文触发短语:
- 中文:"读取 docx", "解析 docx", "打开 word 文档"
- 英文:"read docx", "parse docx", "extract from word document"
- 文件扩展名 ".docx"
## 3. 验证和测试
- [x] 3.1 验证 skill.md 文件格式是否符合项目规范
- [x] 3.2 确认 skill.md 中的触发器能够正确识别 docx 解析需求
- [x] 3.3 确认 skill.md 中的依赖说明清晰准确
- [x] 3.4 确认 skill.md 的 capabilities 覆盖了 docx_parser.py 的所有功能