如何复用这个知识库

如何复用这个知识库

状态:公开 Wiki 草案 生成日期:2026-06-10

可直接复用

  • 来源数量和项目进度;
  • 已公开 WordPress 链接;
  • 已校订样本;
  • OCR 覆盖率;
  • 数字化方法说明;
  • 与相邻项目的关系说明。

需谨慎复用

  • OCR 识别文字;
  • 未匹配到 WordPress 黄金文本的手写页;
  • 未核定的诗题、词牌、年代;
  • 含疑字的句子。

不应复用为定稿

  • raw OCR;
  • 自动生成摘要中的未证实判断;
  • 私有文件路径;
  • 未公开图像或家庭补充材料;
  • 未确认亲属关系推断。

推荐输出

输出 当前可行性 说明
WordPress wiki 可持续更新 适合发布进度、来源图和样本
博客综述 可做 强调抢救性数字化和流程
电子书 尚需校订 需要连续页序和审定文本
学术式整理说明 可做 可引用来源层级和疑字处理规范

写作原则

这个项目的价值不只是 OCR,而是“证据链”:

照片来源
  -> 图片清册
  -> OCR 底稿
  -> WordPress 黄金文本匹配
  -> 上下文校订
  -> 疑字表
  -> 繁体审定文本
  -> WordPress wiki / 电子书