这篇文章围绕“如果要将某物保存 100 年,该如何做”这一问题展开,探讨了多种数字存储方法及相关问题,主要内容如下:
- IBM 350 磁盘存储单元:20 世纪 50 年代,99 Notre Dame Avenue 的 IBM 第一西海岸实验室设计并建造了 IBM 350 磁盘存储单元,它是第一个包含类似硬盘驱动器的计算机系统,其旋转铝盘和磁臂技术使数据检索速度大大提高,但 6 年内就被淘汰,如今仅存 3 个系统和 7 个磁盘驱动器,恢复其数据需要多个机构合作。
硬盘存储(Hard Drives):
- 包括硬盘驱动器(Hard Disk Drives)和固态硬盘(Solid State Drives),前者数据存储在旋转的磁涂层金属盘上,后者数据存储在作为逻辑门的互连半导体细胞内。
- 硬盘的基本原理未变,但其机械结构易导致故障,在合适条件下理论上可长期使用;固态硬盘无机械部件,读写速度快,但寿命有限,未通电时数据会丢失,长期存储需定期复制,且对温度等条件要求高。
- RAID(冗余磁盘阵列)技术可提高硬盘可靠性,不同级别和变体可根据目标进行配置,但仍需维护和检查。
- 对于长期存储,单硬盘不单独使用,需创建并维护相关机构来保障其运行,同时要考虑硬件和软件的维护。
云存储(The Cloud):
- 云是数据中心的集合,依靠服务器和已讨论的计算及硬盘技术存储大量数据,优势是减轻硬件软件升级负担、无需担心物理保护,但目前数据中心设计仅适用于稳定条件,面临多种物理威胁,如火灾、水灾等,且云存储需付费,公司运营存在倒闭风险,目前主导云存储的公司文化注重增长而非稳定性。
- 云已成为数据存储和软件运行的主要方式,多数档案馆等都使用云存储服务,但在和平时期缺乏保护文化遗产的法律框架,当前云服务营销未提及文化或历史 preservation。
可移动媒体(Removable Media):
- 包括 vinyl records、tapes、optical discs 等,其中 Voyager Golden Records 可在星际空间保存超过 10 亿年,但大多数可移动存储设计并非如此,它们易受环境因素影响,如 vinyl records 怕热、磁带易受磁场影响等。
- 数字可移动格式如 CDs、DVDs 易出现化学变质,不同格式的保存情况各异,且有些格式未经过时间检验。
- 可移动媒体可复制分发,具有一定的长期保存潜力,如 vinyl records 已复兴,磁带驱动器容量大、成本低,但也有初始设置成本高、写入速度慢等缺点。
物理存储:打印与唱片(Make It Physical: Print and Rock):
- 历史上,石刻和泥板书写是保存书面和视觉媒体的方法,但耗时、成本高且不易更新。
- 印刷书籍通过印刷、复制、保护等方式可实现世纪级存储,虽自然去中心化,但存在数量庞大、需保管等问题。
- 印刷书籍的优势是可重复印刷,劣势是需大量空间和人工,且并非所有书籍都能被保存。
分散存储(Dispersal):
- 分散存储是世纪级存储的一种解决方案,将数据分散到世界各地,但当前互联网和计算未去中心化,主要公司产品未采用开放协议。
- LOCKSS 是一种数字保存策略,通过分布式网络存储学术期刊副本以确保数据安全,但受版权限制。
- 盗版和非法文件共享平台如 Sci-Hub 等虽违反知识产权法,但在一定程度上起到了保险作用,而完全去中心化的系统如 InterPlanetary File System 等存在法律和技术问题。
- 区块链-based 系统虽有“持久性机制”,但存在加密、定价等问题,且加密货币社区未投入足够的数字保存工作。
- 分散存储的关键问题是能否激发人们的保护意识,中心化系统虽有风险,但能激发人们的保护行为。
答案与非答案(Answers and Non-Answers):
- 世纪级存储的关键在于维护,软件和文件格式也需要维护,目前唯一可行的保存软件的方法是日常维护。
- 有一些工具和协议可帮助减轻维护负担,如 Web ARChive、Fedora 等,但数字保存仍面临资源不足的问题,美国在这方面投入极少。
- 成功的世纪级存储需要社会对数字保存的大规模投资,存储提供商应重视软件保存,个人也应采取多种备份方法并培养保护意识。
- 关于作者:Maxwell Neely-Cohen 是 Library Innovation Lab 的研究员,其作品涉及多个领域。
- 致谢:列出了编辑、设计等相关人员及提供支持的机构。
总之,文章全面探讨了多种数字存储方法及其优缺点,强调了世纪级存储需要社会的重视和投入,以及个人的保护意识。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。