如何保存数据跨越 50 年? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sillydaddy
0.68D
0.15D
V2EX    问与答

如何保存数据跨越 50 年?

  •  
  •   sillydaddy 2 天前 3585 次点击

    每次换电脑和手机,数据都非常容易“被动丢失”,随着这些硬件的丢弃而被遗忘。目前仅针对最重要的数据,有一些零散的备份。所以准备针对数据备份,做一个系统的规划。

    在我心目中,数据的重要性是分层的:核心重要的数据,在 100GB 以内,不能丢失。其他有价值的数据,控制在 1TB 以内,可以有损耗,可能会被新的覆盖。

    如果希望重要数据不丢失,该怎么做?考虑过用多个小体积的 U 盘备份,但 U 盘似乎很不可靠。

    体积小,方便操作很重要,数据可靠很重要。

    硬盘还要充电刷新,光盘还要找光驱。嫌麻烦。最好 2~3 年不用动。

    另外,听说现在硬件都可能有坏道或坏块,是不是要上 PAR2 这种纠错的工具?

    大家都是怎么做的呢?

    第 1 条附言    14 小时 9 分钟前
    来还个愿,把目前的方案分享一下:

    首先介绍一下 PAR2 ,它使用里得所罗门编码生成校验和纠错码,可以把它看作是冗余数据。比如说,假如源文件 10MB ,每个包(切片) 1MB ,源文件相当于 10 个包。而 PAR2 可以生成最多 65535 个冗余的包。这里最有意思的地方是,将****任意****10 个冗余包组合起来,都可以恢复原始文件(甚至都不需要原始文件的参与)。这对于数据恢复来说,太好用了。

    而且,PAR2 可以用作数据校验功能,看某些数据包是不是遭受了 bit rot ,用它的 verify 简单验证一下就可以,不仅可以识别出原始文件是否遭到了破坏,甚至可以识别出那些冗余包是不是有问题。

    所以,有了 PAR2 这样一个神奇的工具,一个比较好的方案基本就确定了。那就是将由 PAR2 生成的非常多的冗余包(比如 500%个冗余包),分散到****各个介质****中,这些冗余包一旦凑齐 100%的数量,就可以恢复原文件。目前准备使用 U 盘、机械硬盘、网盘这 3 种介质,分别作为短期、长期的存储方式,U 盘暂存待归档的,而机械硬盘和网盘用作归档,半年通电更新一次。

    使用冗余包分散的好处,避免了扇区损坏导致的单个文件被损坏导致整个文件失效的问题,尤其是在网盘上一旦局部损坏则整个文件就不可用了,甚至连恢复的机会也没有。而在分布式冗余包这种方案中,做到了真正意义上的多点备份。每个冗余包都可以成为助力恢复的一员,在保持安全性的同时,大大提高了存储效率,或者在相同存储效率下,大大提高了安全性。比如假设 10 个冗余包就可以恢复原文件的话,在 U 盘、SSD 硬盘、机械硬盘、网盘上,假设各有 12 个冗余包,那么只要这 4 个介质中的共 48 个冗余包能凑齐 10 个可用的(也就是被破坏的数量少于 38 个),就可以恢复。对比将整个文件存储在 4 个介质上,占用的存储空间几乎没变,但安全性相比变得非常高了。
    60 条回复    2025-11-18 19:15:18 +08:00
    dji38838c
        1
    dji38838c  
       2 天前   6
    害,50 年后,甚至 20 年后
    你再看到这些数据,就想,这都是些什么呀,完全不值得保存
    xtreme1
        2
    xtreme1  
       2 天前
    数据保存 50 年, "嫌麻烦". 你这个根源上就是不可解的.
    cmdOptionKana
        3
    cmdOptionKana  
       2 天前   1
    100G 那个最最重要的数据,可以用 RAR 打包,纠错百分比弄个 5%或者 9%,本地保存在两个硬盘,再上传到一两个网盘,每年检查一下本地数据,每 3 年或 5 年重新上传一次到网盘。

    1TB 那个,本地一份或两份,网盘一份,基本上也不会有太大问题了。
    calano
        4
    calano  
       2 天前
    不经常用的话,对象存储归档可以试试
    paopjian
        5
    paopjian  
       2 天前   1
    U 盘最容易坏了, 机械硬盘和磁带是比较保险的办法, github 他们是走的微缩胶片, 还有种奇葩的是打印二维码到纸上, 这个项目 https://github.com/cyphar/paperback, 只要纸不坏内容就不丢, 最极端不就是刻在石头上么, 以前是刻字现在可以刻二维码了
    adimn
        6
    adimn  
       2 天前
    写到纸上, 落到事物上
    doomzc
        7
    doomzc  
       2 天前
    好奇什么数据要存 50 年 我感觉我活不到。。。
    jacketma
        8
    jacketma  
       2 天前
    中华五千年文明,有用的书籍不超过 1M 。OP 想想 100GB 得有多大价值哈
    otakustay
        9
    otakustay  
       2 天前
    考虑到你真的很嫌麻烦,那么 google drive + one drive + icloud ,赌这 3 家有任意一家活过 50 年是最合适的
    cmdOptionKana
        10
    cmdOptionKana/strong>  
       2 天前
    @jacketma 那是因为古代没有视频资料。
    SURA907
        11
    SURA907  
       2 天前
    磁带
    JoeJoeJoe
        12
    JoeJoeJoe  
    PRO
       2 天前   1
    可以考虑下光盘, 核心数据存光盘, 多存几张
    ablu
        13
    ablu  
       2 天前
    有个 up 谈三圈,他们是刻到晶圆上了确实能保存很久
    busterian
        14
    busterian  
       2 天前
    自建云盘踩了很多坑, 一年连续挂三块硬盘, 两块固态一块机械, 整盘数据丢了两次份还好之前移动硬盘有定期备份但是也丢了一大堆数据.

    回头看 onedrive 拼车一年 30 块钱 1T, 应该综合下来最靠谱的方案了.
    sillydaddy
        15
    sillydaddy  
    OP
       2 天前
    @dji38838c 等老了只剩回忆时,还是有用的。
    @calano @otakustay @busterian 看了下,云归档确实不错。价格也可以。

    @ablu @SURA907 倒不是说 50 年完全不动它,隔 2~3 年手动操作一次也行,毕竟还要追加数据。但想想 2 ,3 份数据,都要校验一遍、拷贝一遍,也挺麻烦。
    jacketma
        16
    jacketma  
       2 天前
    @cmdOptionKana 古人的壁画就是现在的图片,多刻几副基本上就能描绘事件啦,就是刻的有点辛苦
    sillydaddy
        17
    sillydaddy  
    OP
       2 天前
    @busterian 硬盘这么不靠谱嘛?看来还是用 U 盘,再加上云备份,起码 U 盘体积小,上次我买的移动硬盘已经不知道丢哪里去了。那么大体积,磕磕碰碰的。
    AutumnVerse
        18
    AutumnVerse  
       2 天前 via iPhone
    我是本地存 nas ,做 raid1
    然后加密云同步,同步到 onedriver 和百度网盘

    仅有百度网盘,onedriver ,我本地两块硬盘同时损坏的时候才可能丢失,我觉得存储 50 年没问题
    RinGress
        19
    RinGress  
       2 天前
    商业 NAS (如群晖+企业盘)
    家里一台,老家一台(备份)。健康状态监控推送开起来。7-8 年更换设备。
    你这个需求,预算、方便、可靠性基本是不可能三角。
    sillydaddy
        20
    sillydaddy  
    OP
       2 天前
    @RinGress NAS 实在折腾不起来,光那么多概念都头大了,心理门槛太高。
    iOCZS
        21
    iOCZS  
       2 天前   1
    人最终还是要放弃一切的
    AV1
        22
    AV1  
       2 天前
    @jacketma
    视频不只画面呀,还有声音呢。
    人类能够把声音记下来的历史也就 140 多年而已。
    pingdog
        23
    pingdog  
       2 天前 via Android
    光盘/LTO 磁带,存个 30 年不是问题
    davidyin
        24
    davidyin  
       2 天前 via Android
    有些数据挺重要的,比如照片,过去照片印出来,放着几十年还能看。现在都是手机拍的,丢了,就丢了。
    willygeek007
        25
    willygeek007  
       2 天前
    现在应该有激光刻印了吧,把你的数据刻在石碑上。自己说过的牛逼的话,还有自画像,通过激光刻印出来
    Ketteiron
        26
    Ketteiron  
       2 天前   1
    五十年比较难。
    损坏文件主要有这些因素:磁盘老化、坏道、比特翻转+纠错/校验失败。
    如果是真的非常重要的数据,仅仅保证不丢失是不够的,像图片编码损坏几个 byte 会表现出几个像素有问题,但它的原始版本已经永久性消失了。如果是一些特定编码,例如压缩包损坏一个字节就打不开了,而视频根据损坏的区域不同(索引、关键帧、普通帧)会有不同的后果,但都是不可逆的损失。
    这些问题催生了 ZFS ,ZFS 假设硬盘完全不可靠,随时随地会发生各种静默错误损坏文件。
    如果你想要长时间、极度可靠地保存重要文件,需要 3-2-1 备份,尽量使用 ZFS+ECC ,还有 BTRFS 这个选项。

    但是正常人要实施且长时间维护这样系统说实话过于困难,不管是金钱还是时间。
    PAR2 可以看做是 ZFS 懒人版,也算是个能用的方案。

    我现在已经放弃折腾 ZFS 了,所有文件都放在 PC 上的 4 块 2T 固态里,维护一个哈希列表,配合一些冗余校验方案,脚本定时同步到各大网盘,定时扫描/检查是否发生文件损坏。即使哪天固态寄了也就换一块的事。

    冷存储是一个极度理想化的方案,假定数据保存数十年不会发生变更,但事实上把时间跨度拉长到几十年,发生数据损坏几乎是必然现象,而真正能保证可靠持久化的存储技术普通人花不起这钱。
    相对来说热存储是储存数据的最佳方案,最简单就是定时把数据同步到两个以上网盘。现代人类脱离了网络就无法生存,其实数据也一样,只有热的、活着的数据才能不断校验它是否发生了变更,而放进冷藏室的数据你只能祈祷数年、数十年后取出来与原本完全一致,但这是不可能的。

    数据的可靠性不取决于工具、方式,而是取决于投入的时间。
    usn
        27
    usn  
    PRO
       2 天前
    就这么放着,不用刻意去存
    pweng286
        28
    pweng286  
       2 天前
    50 年后我还活着吗.
    busier
        29
    busier  
       2 天前 via iPhone
    只能是光盘 并且干燥阴暗保持

    时间太长 磁存储器早退磁了 半导体存储器电子也早逃逸了
    meteora0tkvo
        30
    meteora0tkvo  
       2 天前
    如果是照片,打印出来,塑封好。比什么数字介质保存都靠谱
    zhangzhi0000
        31
    zhangzhi0000  
       2 天前
    把字刻在石头上
    Essaim
        32
    Essaim  
       2 天前
    现在需要备份的配置,我现在是 iCloud 一份(部分,比如手机备份,照片),nas 本地一份,百度一份(加密),115 一份(加密)。
    然后云盘备份都是定期跑的,我不信这些能同时嗝屁,倒是现在数据存的比较分散,在想怎么整理一份电子遗书好整理数字资产。
    ltyj2003
        33
    ltyj2003  
       2 天前 via Android
    原始人在岩壁上作画,能保存上万年。
    古人写在竹简放墓里,能保存上千年。
    区区 50 年,没啥难的。
    1975 年的资料现在还不是随便找。
    买块机械硬盘存好,注意阴凉干燥,放 50 年没一点问题。
    netnr
        34
    netnr  
       2 天前
    M-DISC 千年光盘
    sillydaddy
        35
    sillydaddy  
    OP
       2 天前
    @Ketteiron #26
    损坏文件用带冗余纠错的应该就可以解决吧。不过确实需要不停的介入,防止“耗散”。下面是我准备的各方面平衡的一个方案,最主要是省事,不知道可行不可行:

    云存储可以考虑使用国内的阿里云。或者 Google Drive ,One Drive ,后者贵一些。

    核心数据在 100GB 以内:云上 2 份,一份冷存储,一份网盘。本地 U 盘 2 份。本地的每 2 年校验一次。云上的 10 年校验一次。另外可以加一份蓝光光盘 10 年校验一次。每种都是每 2 年增量更新一次。

    非核心数据在 1TB 以内:本地 SSD 硬盘 2 份。每 2 年校验、整理、更新一次。

    成本:总计 2 个网盘( 27 元/年+140 元/年),4 个 U 盘/SSD 硬盘( 50 元/年 * 4 份),1 个光盘( 10 元/年)。合计 380 元/年。

    U 盘或 SSD 硬盘,体积小。用来备份的话,很少擦写,寿命应该比较长。云盘自带冗余备份,基本不用担心数据问题损坏。

    主要是不知道怎么监测坏块,及时更换快要坏掉的盘。如果有坏块,PAR2 该怎么修复呢?需要 dump 全盘然后修复吗?
    dfdd1811
        36
    dfdd1811  
       2 天前
    我 20 年前觉得重要的存在软盘上的东西,现在都读不出来。或者那块 80g 的 ide 接口的硬盘,我知道里面有我不少初中时候的照片,我费劲给他弄出来又有什么意义。我都结婚了,初中喜欢的女生还重要吗,不重要,不如高中大学的美女同学们重要,当然她们我是存到现在了
    EdmondGUO
        37
    EdmondGUO  
       2 天前
    @otakustay 完全不需要任意一家活过 50 年,只要他们不会同时倒闭就可以了
    weegc
        38
    weegc  
       2 天前
    可以手写 0101 保存到纸质,50 年应该问题不大
    duanxianze
        39
    duanxianze  
       2 天前
    不要指望一劳永逸,必须定期检查,多重备份
    Stop
        40
    Stop  
       2 天前
    存在 gmail 里面保存多少年了?二十年有没。
    shiny
        41
    shiny  
    PRO
       2 天前
    怎么没人做个专门的数据保存公司
    layxy
        42
    layxy  
       2 天前
    自己搞个 nas 然后多云备份,确保至少有 3 个不同的云厂商,这样倒一个换一个,本地挂了云恢复,如果本地和三个云同时都挂了,那大概率你已经不需要这些数据了
    Moatkon
        43
    Moatkon  
       2 天前
    我目前是存 Google 上,然后硬盘再备份一遍。以 Google 为主。
    longsays
        44
    longsays  
       2 天前 via Android
    @sillydaddy 冷数据机械硬盘还是比 U 盘靠谱吧,U 盘和固态硬盘也是需要定期通电的
    Ketteiron
        45
    Ketteiron  
       2 天前
    @sillydaddy #35 U 盘/SSD 如果不经常通电可靠性远不如小容量机械硬盘。
    核心数据我建议至少两个网盘,必要的话多加一至两个 OSS 。
    M-DISC 盘虽然便宜,但是读写设备贵,高档的要上千块,而跨越长时间的写和读,通常是两个不同设备,设备本身也会老化,新的不一定会兼容旧的。
    如果是连接 PC 的硬盘,检测坏道加个开机脚本,或者每隔几个月用 CrystalDiskInfo 看一下硬盘健康度,不通电的没办法,祈祷它别坏。
    PAR2 是对一个压缩包做冗余,如果将来重新读取这个压缩包,损坏数据小于冗余体积就能恢复,一般需要专业软件,例如 MultiPar 。
    Wh1t3zZ
        46
    Wh1t3zZ  
       2 天前 via Android
    数据能丢失并且没有影响生活,说明不是什么重要数据
    FrankAdler
        47
    FrankAdler  
       2 天前 via Android
    综合成本时间可靠性,只有云盘最合适的
    JackTone
        48
    JackTone  
       2 天前
    google drive , 续费一个 50 年会员

    如果怕 Google 倒闭,可以 xx drive 都备份下
    lonely701
        49
    lonely701  
       2 天前
    机械硬盘可以保存 50 年,再长就需要磁带了
    hacson
        50
    hacson  
       2 天前 via iPhone
    嫌自己维护麻烦那就充值 2 个网盘,现在网盘容量都是 TB 级别了,够你用了,自己半年左右登录检查检查,平时注意下邮件就行,大网盘真要是倒了会提前通知
    folnet
        51
    folnet  
       2 天前
    磁带保存
    91pornshanghai
        52
    91pornshanghai  
       2 天前
    才 100g ,买盒档案级的光盘多刻几张,不能用 usb 光驱,要那种 12v 供电的大光驱
    iv8d
        53
    iv8d  
       1 天前 via Android
    光盘吧,这个能存很久,保持干燥不要划痕
    HTravel
        54
    HTravel  
       1 天前
    @Ketteiron 对普通人来说,防止长时间下的文件损坏其实很简单。就是每年把自己的核心数据打成一个 zip 包,且要尽可能保证永不删除,存储时命名就带该包的哈希值即可。

    这样的话,也就是每年甚至几年校验一次,精力投入很小,甚至校验都可以让 AI 写成自动化脚本。校验不通过无所谓,因为本就是 321 备份原则。但 321 只是最低原则,不是足够原则。老机械硬盘别卖,攒起来,没的话趁低价时买几块。压缩包就可以在上面再存一份。所以很容易找到尚未损坏的正确副本进行恢复。
    sillydaddy
        55
    sillydaddy  
    OP
       1 天前
    @longsays
    @Ketteiron
    幸亏你们提醒,查了下,U 盘和 SSD 盘,都是需要定期通电,断电情况 2 年都坚持不了。。机械硬盘的数据靠磁性物质,很持久,但机械硬盘里面的零件固件润滑油也需要定期通电,否则也会出状况。。想归个档太难了。
    zzxCNCZ
        56
    zzxCNCZ  
       1 天前
    @sillydaddy #55 蓝光光盘啊,一张 25g ,完全够了。便宜,量大,稳定。就是刻录设备贵点。应该是目前为止最长的流行存储介质之一了。
    arthurblake
        57
    arthurblake  
       1 天前
    @dji38838c 照片还是值得的,我所有的备份方法(网盘,nas ,自建存储)都是为了保存照片。
    Eagleyes
        58
    Eagleyes  
       1 天前
    100G 的数据完全不叫事。

    最简单的办法,保证不少于 2 地,3 份进行保存。

    简单说就是,所有数据本地用机械硬盘,存 N 份( N>=2)一模一样的数据,并且异地保存。额外在大厂云盘上存储一份。
    异地存储,可放地震,水火。且双介质保存,同时损坏的概率极低,最差还有云端一份,几乎可保万全。

    数据每年拿出来读取一次,5-10 年更换一次存储介质(其实冷备份的话,10 年后硬盘也几乎没有损坏,但为确保万无一失还是要用新硬盘替换到原来的硬盘,继续存储。
    johnwonderful
        59
    johnwonderful  
       1 天前
    把 50 年分成 10 个 5 年,定期检查,还是要光盘好点,优秀的保存好的光盘大几十年没问题
    PythonYXY
        60
    PythonYXY  
       1 天前
    跟简单,把问题交给云服务工程师解决,毕竟公司可是花了数亿资金雇人来解决数据丢失问题的。唯一代价就是持续地付费。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2457 人在线 nbsp; 最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 41ms UTC 15:36 PVG 23:36 LAX 07:36 JFK 10:36
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86