Skill/openspec/changes/archive/2026-03-08-create-lyxy-reader-html-skill/tasks.md at 6b4fcf26471d992c5311c6a46d1e8785db7efdd4

lanyuanxiaoyao 6b4fcf2647 创建 lyxy-reader-html skill

- 新增 skill: lyxy-reader-html，用于解析 HTML 文件和 URL 网页内容
- 支持 URL 下载（pyppeteer → selenium → httpx → urllib 优先级回退）
- 支持 HTML 解析（trafilatura → domscribe → MarkItDown → html2text 优先级回退）
- 支持查询功能：全文提取、字数统计、行数统计、标题提取、章节提取、正则搜索
- 新增 spec: html-document-parsing
- 归档 change: create-lyxy-reader-html-skill

2.4 KiB

Raw Blame History

1. 初始化 Skill 目录结构

2. 创建 SKILL.md 主文档

3. 实现 common.py 公共模块

4. 实现 downloader.py URL 下载模块

5. 实现 html_parser.py HTML 解析模块

6. 实现 parser.py 命令行入口

7. 创建参考文档

2.4 KiB Raw Blame History Unescape Escape

1. 初始化 Skill 目录结构

2. 创建 SKILL.md 主文档

3. 实现 common.py 公共模块

4. 实现 downloader.py URL 下载模块

5. 实现 html_parser.py HTML 解析模块

6. 实现 parser.py 命令行入口

7. 创建参考文档

2.4 KiB

Raw Blame History