生活在数码的时代,相信每个人都有自己的数据,照片也好,视频也好,都是我们美好的生活回忆。

怎么能安全的保存这些数据?避免因为意外情况导致的数据丢失,是我最近感兴趣和研究的方向。

我的文件

我的数据主要是下面几类,每种类型对数据安全性的要求也不同。

照片和视频

记得 2005 年高二,买了我人生中第一台数码相机,一直到现在电脑里存放了我 20 年所有的码照片和视频。也把我和家人所有的交卷照片扫描成为电子版保存。

有了小孩之后,给小孩拍照和视频的数量在持续增长, 现在有大概 500G 的照片,和将近 700G 的视频。

这部分数据要保证万无一失的存储,不计成本。 毕竟是这么多年来留存的回忆,存储时间至少会大于我的寿命。

收藏的高清电影和音乐

喜欢电影,收集了很多高清电影资源,大概有 7T 左右的电影和电视剧。 使用 AppleTV 在局域网播放, 使用投影仪观看。 也有 200G 左右的 CD 抓轨的音频。

这部分数据是从网络下载的,意外丢失也没太大问题,收集整理还是花了一些功夫的,希望能以低成本的方式保证数据安全。

文档和代码工程

有自己写的一些文档,还有一些自己写的代码工程, 还有一些自己设计的 3D 模型等。

这部分数据也需要万无一失的存储,并且最好能追踪版本变化。

我的存储方式

现在数据主要是存在我的 NAS 系统里。 使用的是 HP Gen8 的 MicroServer。 安装了 Windows Server 2016。

HP Gen8 MicroServer

4 盘位,加了2个 SSD, 共 6 块盘。

分布是:

  • 4T + 4T 组 Raid 1 = 4T,西数红盘 CMR。 用来存储照片,视频和文档。数据同时存2份在2块硬盘,能保证不是2块硬盘同时损坏的情况下,数据不丢失。
  • 4T 单盘 Raid 0 = 4T,西数红盘 CRM。用来存储电影电视剧和音乐,没有备份。组 Raid 0 只是为了用阵列卡可以识别硬盘。
  • 3T 单盘 Raid 0 = 3T,西数红盘,当年从西数出的网络硬盘盒里拆出来的。
  • 256G 单盘 Raid 0 = 256G, 三星 SSD, 用来做系统盘。
  • 256G 单盘, 使用 PCIE 卡转 M.2 接口。 用来做 PT 盘,网传都说 PT/BT 伤硬盘,所以我都是先下载到这块盘,再复制到机械硬盘上,做种也是在这块盘上。

这里另外说一下, 很多 HP Gen8 的配置教程,上来就是禁掉阵列卡,貌似还引起风扇狂转,顶置的这个SATA 接口的盘不能引导系统等问题。这个是不对的, 直接进配置工具配置阵列卡, 单盘也可以做 Raid 0,挂载好之后,使用和普通磁盘是一样的。拿下来的磁盘,通过硬盘盒直接插到电脑上,数据也是可以正常读写的。

其中存储重要数据的2块磁盘,也是 2022 年才更换的新盘,之前是两块 1T 的西数红盘 从 2015 年开始使用,安全服役了 7 年。虽然没有损坏,不过为了数据安全,还是更换了新盘。

为了防止勒索病毒,我所有的盘里的数据,通过 SMB 协议共享出来,都是只读的。其他设备可以读取文件,不能修改。

然后在每个盘建立了一个叫 Upload 的文件夹,这个文件夹其他设备有写权限的。需要将文件存储到 NAS 服务器上, 就先把文件拷贝到 Upload 文件夹,再远程桌面登录 NAS,通过远程桌面移动文件到相应的文件夹,因为在同一个磁盘,文件移动只是修改文件分配表,速度非常快。NAS 这个系统里面,不轻易安装软件,也不执行拷贝到各个盘里的程序。

另外,照片和视频文件,还存储到了阿里网盘中,我在阿里网盘内测的时候, 抢到了 3T 的永久存储空间。

3-2-1 数据备份策略

要想保证你的数据安全,那只有一种办法, 就是备份,备份,备份! 重要的事情说三遍。

只要有足够多的备份,那数据就足够的安全,但同时备份越多,花费的成本就越大,要在成本和安全之间寻求一个平衡。

3-2-1 是一种数据备份策略,让数据可以在数据丢失事件发生后快速得到恢复和还原。

简而言之,我们的数据需要:

  • 三份数据副本
  • 其中两份副本存储在本地的不同介质上,例如一份存储在电脑的内置硬盘上,一份存储在外置硬盘等可移动存储设备上
  • 一份数据副本远程存储在云备份软件等异地解决方案中

实施 3-2-1 备份策略的目的是为了降低“单点故障”可能造成的影响。这意味着,如果一台设备崩溃并清除了一份数据副本,那并不是世界末日,我们手头还有两个选择可以挽救局面!

现在还有更新的说法,叫 3-2-1-1-0 策略,在 3-2-1 策略的基础上,增加了一份离线副本,数据离线了,不能被访问了,就能避免误删除或者病毒等造成的数据丢失。

离线存储探索

按上面说的备份策略,我应该还缺一个离线存储, 所以开始研究离线存储介质:

M-DISC 千年盘

《三体》里面有关于如何让数据保存的时间更长的描述,办法是刻在石头上。

M-DISC

M-DISC 是由 Millenniata 公司在 2009 年发明的一次性写入技术,就是用特殊的高功率激光刻录机,将数据刻录在特殊材料制成的 BD-R 光盘上。和普通的刻录光盘比,专门设计的材料能保存更长的时间,号称能保存 1000 年。

刻录 M-DISC 需要特殊支持的蓝光刻录机,光盘和刻录机的品牌有:铼德、威宝(Verbatim)、清华紫光等。

查了下价格, 在2024年这个时间点, 刻录机大概 RMB 800 元左右。 光盘 RMB 20 元左右一张,25GB 容量。平均 0.8元 / GB。

优点:

  • 只读介质,写入后不能更改。
  • 保存时间长,体积小,对存储要求低。

缺点:

  • 存储容量小,成本高。

LTO 磁带

磁带听上去是个很古老的东西,其实在专业存储领域,磁带一直在发展,经过多年的技术竞争和迭代,最终 LTO (Linear Tape Open) 标准脱颖而出,成为市场的主流。

LTO

从2000开始,经过了多个版本的迭代,已经从 LTO-1 发展到了 LTO-9,单盘磁带的容量也从 LTO-1 的 100GB 发展到 LTO-9 的 18TB。

磁带现在主要用在数据中心,所以价格也贵的离谱,LTO-9 的磁带机价格基本是 RMB 5W 左右, 一盘 LTO-9 的磁带 要 RMB 1000 块左右。

那为啥还要写这一部分呢,因为磁带机的更新换代,我们可以捡垃圾啊。

LTO 迭代的规则是, 每一代磁带机,可以读写本代和上一代的磁带,可以读取上两代的磁带。 也就是说 LTO-6 的磁带机,可以读写 LTO-6 和 LTO-5 的磁带, 可以读取 LTO-4 的磁带。

而某鱼海鲜市场,LTO-6 的二手磁带机大概 1500 元左右。 LTO-6 磁带大概 RMB 80 元左右,2.25 TB,平均 0.0355 元 / GB。而 LTO-5 的磁带大概 RMB 25元左右,1.5TB,折合 0.01667 元 / GB。

优点:

  • 存储容量大,成本低。使用二手磁带成本非常低。
  • 可以增量备份。

缺点:

  • 只能顺序读取,不能随机读取。
  • 备份的流程较复杂。
  • 存储时要避免接触有磁性的物质。

机械硬盘

把接卸硬盘直接拆下来,也能作为离线存储。

WD HD

看了下价格, 西数红盘 4TB 的价格在 800左右, 平均 0.2元 / GB。

再加上硬盘比较脆弱,怕磕碰。

优点:

  • 可以随机读取,读写速度快。

缺点:

  • 比较娇贵,怕磕碰。

总结

存储介质驱动器价格(元)存储器价格(元)存储器容量(GB)平均成本 (元/GB)
M-DISK BD-R80020250.8
磁带 LTO-615008022500.0355
磁带 LTO-58002515000.01667
机械硬盘080040000.2

从数据上看,使用磁带有巨大的成本优势,虽然是二手的设备,如果能买到成色比较好的,寿命还是有保证的。

我的离线存储方案

我最终选择了 LTO-6 的磁带驱动器进行离线存储,型号是 HP LTO Ulitium 6250 磁带机。 磁带主要选择了 LTo-5 的磁带。

因为现在 LTO-5 的磁带相当便宜, 买 LTO-6 的磁带机是因为 LTO-6 的磁带机相较 LTO-5 的价格差距不大,毕竟电子产品买新不买旧。

下面两篇博文详细记录了我折腾 LTO-6 磁带机的详细过程: