版本与来源说明
状态:公开 Wiki 草案 生成日期:2026-06-10
名称说明
材料中可见 `李應繁` 与 `李應凡` 两种写法。当前整理采取保留来源写法的 原则:
- 页面标题和项目名使用 `李應繁`;
- 原图、题页、WordPress 文字中出现 `李應凡` 时照录;
- 后续版本说明中记录异名和使用场景。
WordPress 与 ScienceNet
William 已说明:ScienceNet 不好抓也可以暂不处理,因为 WordPress `liweinlp.com` 有冗余,且作为 sources 更全面。
因此本项目当前优先级:
- WordPress;
- 照片 / 扫描件;
- OCR 和校订;
- ScienceNet 作为历史冗余和校勘线索。
图片包
Google Photos 导出包含多个 zip 包,存在重复。当前做法:
- 不删除重复来源;
- 对唯一图片编号;
- 保留重复来源路径和 checksum;
- 后续用页序、标题和 OCR 索引进行分卷整理。
OCR 版本
OCR 底稿是机器生成版本,不是文本版本。
公开引用时应写作:
机器 OCR 底稿已生成,正在校订。
不应写作:
全文已完成数字化。
当前版本状态
| 层级 | 状态 |
|---|---|
| 来源保存 | 完成第一轮 |
| 图片清册 | 完成第一轮 |
| OCR 底稿 | 完成第一轮 |
| 公开 wiki | v0.1 草案 |
| 校订文本 | 样本阶段 |
| 电子书 | 未到定稿阶段 |