CBF《中华大字库》三期升级工程规划

CBF《中华大字库》升级工程,分为三期。

  1. CBF2018是一期,完成zw-SDK开发平台的移植,从2012版的delphi版,迁移到更加现代的(zw)Python平台,已便更加高效地利用TensorFlow、PyTorch等深度学习、神经网络系统。
  2. 二期计划是2019-2020年,《中华大字库》CBF2020版,中文字库总数超过1万套,在2012算法模型的基础上,进行深度优化改造。
  3. 三期是“百字工程”,终极目标是“一字”成库。现代AI技术,AODBE的2020版本预览,其中一个升级热点,就是在英文字库方面,采用了类似的技术。


2012年4k云字库,有两个硬性指标:一是母稿精度采用4000×4000像素;二是,中文字库数目总量,超过4000种。

《中华大字库》CBF2018升级版,字库数目总量内测数目超过5000款,当时认为完全没可能,只是野望的指标1,已经超额完成。

2012版的指标2,因为目前算力不够,以及TrueType内部格式上限制约,可能需要等待一个时期。

不过在母稿阶段,我们尽量会采用高精度的模板,这次CBF2018升级版,使用的原始母稿就是1000 x 1000像素的,可以视为1k级别。

至于三期“百字工程”,其终极目标是“一字”成库,现在看来完全不可能,不过随着算法模型的进步,理论上完全可以实现。

参见【字王的野望】 首发于 (2012-05-26) http://ziwang.com/?p=552

【字王的野望】

 

发表评论

电子邮件地址不会被公开。