澳大利亚国家图书馆馆长玛丽-路易斯·艾尔斯与数百万份手写手稿中的一份。图片由Elesa Kurtz提供
所以,如果你想用图书馆的在线档案来追溯你的家谱,这个软件可以让你更容易地回到记录中。
艾尔斯博士认为,这项创新将让家族历史学家和专业历史学家进行更深入的研究。
她说:“如果你把好奇的澳大利亚人与一个宏伟的收藏品放在一起,你会看到奇迹发生。”
实现这一飞跃需要两个步骤:首先,所有过去的信件、日记和购物清单都必须数字化——也就是说,扫描并转化为可以放到网上的图片。这是非常简单的部分。它不是一场革命。
不那么简单的新方法是引入一种技术,可以识别笔迹——有时是潦草的潦草笔迹——并将其转化为可搜索的文本。
该图书馆一直在与大型科技公司合作。该项目的负责人埃里克·斯温(Eric Swain)说,结果是,图书馆的在线档案中现在有大约1万页手写页面,其中2000页现在可以搜索。
图书馆将在2024年大力推动更多的可用性。最终,所有950万页的手写页面都可以被搜索到。
左边是班卓·帕特森写给妻子的信,翻译成纯文本。
电脑在阅读人类笔迹方面并不完美。它会把潦草的字迹弄错,所以国家图书馆将依靠它的志愿者大军来纠正这台机器。有一个无偿但非常热心的社区,他们会检查准确性。
以诗人班卓·帕特森1905年写给妻子的一封信为例。
信的开头写着“亲爱的爱丽丝”,字迹相当整洁。在Trove网站上,“亲爱的爱丽丝”(Dear Alice)这几个字出现在左边的方框里,而在右边则是班卓写的。向下滚动右边的书写页,左边的字体也随之移动。
再往下看,字迹越来越差,机器就会出错:机器无法翻译“你亲爱的丈夫”,所以它只能翻译出一堆乱七八糟的字母。毫无疑问,爱丽丝能读懂班卓的笔迹,但机器还不能。
但是机器正在学习——很快。