新增docx解析
This commit is contained in:
@@ -0,0 +1,27 @@
|
||||
## 1. 准备工作
|
||||
|
||||
- [x] 1.1 研究现有 skill 定义格式,查看 `skills/` 目录下的其他 skill 示例(如 `python-runner`、`js-runner`)了解标准结构
|
||||
- [x] 1.2 阅读 `skills/docx-reader/docx_parser.md` 了解解析脚本的详细功能和使用方式
|
||||
|
||||
## 2. 创建 skill 定义文件
|
||||
|
||||
- [x] 2.1 创建 `skills/docx-reader/skill.md` 文件
|
||||
- [x] 2.2 编写 skill 的 description 字段,描述该 skill 的用途和定位(优先解析 docx 文档)
|
||||
- [x] 2.3 编写 skill 的 capabilities 字段,列出所有支持的解析功能:
|
||||
- 全文转换为 Markdown
|
||||
- 获取文档元信息(字数、行数)
|
||||
- 标题列表提取
|
||||
- 指定章节内容提取
|
||||
- 正则表达式搜索
|
||||
- [x] 2.4 编写 skill 的 Compatibility 字段,声明 Python 3.6+ 和依赖库要求(markitdown 或 python-docx 至少安装其一)
|
||||
- [x] 2.5 编写 skill 的 Triggers 字段,包含中文和英文触发短语:
|
||||
- 中文:"读取 docx", "解析 docx", "打开 word 文档"
|
||||
- 英文:"read docx", "parse docx", "extract from word document"
|
||||
- 文件扩展名 ".docx"
|
||||
|
||||
## 3. 验证和测试
|
||||
|
||||
- [x] 3.1 验证 skill.md 文件格式是否符合项目规范
|
||||
- [x] 3.2 确认 skill.md 中的触发器能够正确识别 docx 解析需求
|
||||
- [x] 3.3 确认 skill.md 中的依赖说明清晰准确
|
||||
- [x] 3.4 确认 skill.md 的 capabilities 覆盖了 docx_parser.py 的所有功能
|
||||
Reference in New Issue
Block a user