refactor: 移除 doc 和 ppt reader 支持

移除对旧版 .doc 和 .ppt 格式的支持,以简化项目架构和减少维护负担。

变更内容:
- 删除 scripts/readers/doc/ 目录
- 删除 scripts/readers/ppt/ 目录
- 从 readers/__init__.py 中移除 DocReader 和 PptReader
- 从 utils/file_detection.py 中移除 is_valid_doc 和 is_valid_ppt
- 从 config.py 中移除 doc 和 ppt 依赖配置
- 从 advice_generator.py 中移除相关映射
- 更新 CLI 帮助文档
- 更新 README.md 文档
- 删除相关测试用例
- 删除相关规范文档
This commit is contained in:
2026-03-11 00:55:15 +08:00
parent fad0edc46a
commit 65c746c639
22 changed files with 9 additions and 564 deletions

View File

@@ -6,9 +6,7 @@ from .xlsx import XlsxReader
from .pptx import PptxReader
from .pdf import PdfReader
from .html import HtmlReader
from .doc import DocReader
from .xls import XlsReader
from .ppt import PptReader
READERS = [
DocxReader,
@@ -16,9 +14,7 @@ READERS = [
PptxReader,
PdfReader,
HtmlReader,
DocReader,
XlsReader,
PptReader,
]
__all__ = [
@@ -28,8 +24,6 @@ __all__ = [
"PptxReader",
"PdfReader",
"HtmlReader",
"DocReader",
"XlsReader",
"PptReader",
"READERS",
]