如何复用这个知识库
状态:公开 Wiki 草案 生成日期:2026-06-10
可直接复用
- 来源数量和项目进度;
- 已公开 WordPress 链接;
- 已校订样本;
- OCR 覆盖率;
- 数字化方法说明;
- 与相邻项目的关系说明。
需谨慎复用
- OCR 识别文字;
- 未匹配到 WordPress 黄金文本的手写页;
- 未核定的诗题、词牌、年代;
- 含疑字的句子。
不应复用为定稿
- raw OCR;
- 自动生成摘要中的未证实判断;
- 私有文件路径;
- 未公开图像或家庭补充材料;
- 未确认亲属关系推断。
推荐输出
| 输出 | 当前可行性 | 说明 |
|---|---|---|
| WordPress wiki | 可持续更新 | 适合发布进度、来源图和样本 |
| 博客综述 | 可做 | 强调抢救性数字化和流程 |
| 电子书 | 尚需校订 | 需要连续页序和审定文本 |
| 学术式整理说明 | 可做 | 可引用来源层级和疑字处理规范 |
写作原则
这个项目的价值不只是 OCR,而是“证据链”:
照片来源
-> 图片清册
-> OCR 底稿
-> WordPress 黄金文本匹配
-> 上下文校订
-> 疑字表
-> 繁体审定文本
-> WordPress wiki / 电子书