李應繁詩文手稿整理 Wiki:项目入口与进度

李應繁詩文手稿整理 Wiki:项目入口与进度

状态:公开入口贴 生成日期:2026-06-10

《李應繁詩文選》手稿整理已经进入一个可持续更新的 WordPress wiki 闭环:照片来源、OCR 底稿、校订样本、来源地图和版本说明,都有了公开页面。

这个入口贴的作用,是让项目不只停留在后台页面或本地文件中,而是在博客站内 有一个可见入口。后续整理推进时,wiki 页面会持续更新。

Wiki 页面

当前进度

项目 状态
Google Photos 导出 已导入并去重
唯一图片 868 张
机器 OCR 底稿 868 页已完成
WordPress 8797 文本单元 25 个候选单元已索引
校订样本 题页、自序、浪淘沙锚点已开始

说明

机器 OCR 只是底稿,不是定稿。最终发布文本会保留繁体,并继续通过原图、 WordPress 已发表文字和上下文进行校订。

本项目与《李老夫子遺墨》《李名杰回忆录》相互关联,但保持独立语料边界。

发布者

立委

立委博士,多模态大模型应用咨询师。出门问问大模型团队前工程副总裁,聚焦大模型及其AIGC应用。Netbase前首席科学家10年,期间指挥研发了18种语言的理解和应用系统,鲁棒、线速,scale up to 社会媒体大数据,语义落地到舆情挖掘产品,成为美国NLP工业落地的领跑者。Cymfony前研发副总八年,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理