1
0
Files
Skill/openspec/changes/archive/2026-02-12-develop-lyxy-reader-docx-skill/proposal.md
2026-02-12 17:57:05 +08:00

26 lines
1.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
## Why
大模型在处理 Word 文档时缺乏统一的解析工具,需要能够直接识别并解析 .docx 文件能力的 skill。现有的 docx_parser.py 脚本已经实现了完整的解析功能,将其封装为 skill 可以让大模型在遇到需要读取 docx 文档的场景时优先使用该工具。
## What Changes
- 新增 `lyxy-reader-docx` skill封装现有的 `skills/lyxy-reader-docx/scripts/docx_parser.py` 脚本
- 创建 skill 定义文件,支持将 .docx 文件转换为纯文本内容
- skill 定位为 docx 文档解析的优先选择工具
- 仅支持文本内容提取,不处理图片和格式信息
## Capabilities
### New Capabilities
- `docx-text-extraction`: 将 DOCX 文档转换为 Markdown 格式文本的能力,支持全文提取、标题提取、章节内容提取和关键词搜索
### Modified Capabilities
-
## Impact
- 新增 `skills/lyxy-reader-docx/skill.md` - skill 定义文件
- 依赖现有的 `skills/lyxy-reader-docx/scripts/docx_parser.py` 解析脚本
- 新增 Python 依赖:`markitdown``python-docx`(至少需要安装其一)
- 影响大模型的技能调用策略,在遇到 .docx 文件时会优先使用该 skill