迫于互联网上文章被删,求大家存档工具 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
kebamt
V2EX    问与答

迫于互联网上文章被删,求大家存档工具

  •  1
     
  •   kebamt 2021-08-24 09:34:25 +08:00 via iPhone 6795 次点击
    这是一个创建于 1511 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近有一个烦恼,就是自己收藏下来的文章由于各种原因被原作者删除或修改,导致链接失效变成 404 。 有没有一个工具把网页文章内容存档并支持分享(最重要的是能分享),就是你给它输入「文章链接」它把这个链接打印到网页并返回一个可分享文章链接(内容跟原始网页一摸一样的那种),最好是基于 Web,可以为此付费。 试过 Telegraph 不过需要自己一个一个自己搬运,TG 上也看到一些机器人可以把文章打印到 Telegraph 返回链接的,但此原始文章中的图片都没打印出来,都消失了,只有文字。

    42 条回复    2021-08-26 11:44:31 +08:00
    yujiang
        1
    yujiang  
       2021-08-24 09:37:42 +08:00 via Android
    Google/百度快照
    morisakitaku
        2
    morisakitaku  
       2021-08-24 09:39:14 +08:00 via iPhone
    cco
        3
    cco  
       2021-08-24 09:41:13 +08:00
    webarchive dot org
    4ark
        4
    4ark  
       2021-08-24 09:41:18 +08:00 via iPhone
    web archive
    40EaE5uJO3Xt1VVa
        5
    40EaE5uJO3Xt1VVa  
       2021-08-24 09:44:20 +08:00
    没遇到这么一劳永逸的工具.

    现在用欧鹏浏览器遇到好文档一键保存为 pdf
    gesse
        6
    gesse  
       2021-08-24 09:46:10 +08:00
    一般一篇文章你用到的知识点、信息点应该不多, 可以试着复制到笔记软件里总结归类下。

    方便以后的查阅、学习。
    minikyu
        7
    minikyu  
       2021-08-24 09:52:01 +08:00
    印象笔记、语雀、notion 之类的笔记软件都有剪藏功能的,直接保存在笔记里
    phony2r
        8
    phony2r  
       2021-08-24 09:54:13 +08:00   1
    cmd + p 打印成 pdf 文件
    oddcc
        9
    oddcc  
       2021-08-24 10:29:53 +08:00   1
    前两天刚自建了 https://github.com/ArchiveBox/ArchiveBox
    很强大
    webshe11
        11
    webshe11  
       2021-08-24 10:50:15 +08:00
    著名的老牌
    https://web.archive.org/save

    或者
    https://archive.today/

    功能特性 用法各有千秋 个人比较喜欢后者
    kebamt
        12
    kebamt  
    OP
       2021-08-24 12:03:20 +08:00
    @yujiang Google 快照好像早已下线了,输入搜索到的 Google 快照链接会自动重定向到 Google 首页。百度快照好像也死掉了
    kebamt
        13
    kebamt  
    OP
       2021-08-24 12:06:33 +08:00
    @mokeyjay 试了一下这两个后面的插件很不错,唯一缺点是不能网页的形式分享。

    http://web.archive.org/ 这个存完发现部分图片丢失,不知道怎么回事儿
    kebamt
        14
    kebamt  
    OP
       2021-08-24 12:08:33 +08:00
    @webshe11 谢谢,后者存档很完整几乎跟原网页一样,只是生成时间较长,不过可以接受
    v2ka
        15
    v2ka  
       2021-08-24 12:39:20 +08:00   1
    特意研究了下几种保存网页的方法。

    1-保存为 PDF 。(打印-保存 PDF )

    2-保存为离线网页( SingleFile )

    3-云笔记剪藏(印象笔记、onenote )

    4-稍后阅读工具( Pocket,高级版可以保存网页)
    kebamt
        16
    kebamt  
    OP
       2021-08-24 13:10:17 +08:00
    @v2ka 谢谢
    locoz
        17
    locoz  
       2021-08-24 13:49:09 +08:00 via Android   2
    @gesse #6 其实这样还是不太好,因为一篇文章你在不同水平、不同时期看可能会看出不同的东西,理解深度和联想的广度都会不同,能在简单归纳的同时完整存下来原始内容是最合适的。
    webshe11
        18
    webshe11  
       021-08-24 14:12:55 +08:00
    @kebamt #14 archive.today 排队的话可能要一会,不排队的话一两分钟就存好了
    hjq632233317
        19
    hjq632233317  
       2021-08-24 15:34:17 +08:00
    印象笔记剪藏 +1
    D3EP
        20
    D3EP  
       2021-08-24 16:21:50 +08:00
    Pocket 付费
    lxxself
        21
    lxxself  
       2021-08-24 18:02:33 +08:00
    保存为 pdf 、发送内容到邮件、保存到 notion 等等
    Kaiyuan
        22
    Kaiyuan  
       2021-08-24 18:47:26 +08:00 via iPhone
    我现在用的是群晖 Note,完整剪藏。免强可用,主要是数据全在我自己手里踏实。然后群晖又有加密备份到云盘的功能。
    longtzw
        23
    longtzw  
       2021-08-24 18:54:36 +08:00 via iPhone
    Devonthink 保存为 Web Archive,完美
    xarthur
        24
    xarthur  
       2021-08-24 19:48:02 +08:00 via iPhone
    如果你用的是 macOS,可以试试 EagleFiler 。
    crab
        25
    crab  
       2021-08-24 20:29:45 +08:00
    保存本地比如 mhtml pdf 再云备份才是可靠的。
    ThirdFlame
        26
    ThirdFlame  
       2021-08-24 20:53:29 +08:00
    singlefile 保存成单 html
    zhanggong
        27
    zhanggong  
       2021-08-24 22:01:23 +08:00
    Renven1
        28
    Renven1  
       2021-08-24 22:15:50 +08:00
    这样是不是可以结合起来把 V 站每天最热榜给全部保留下来,错过那天就可以回看了~
    Salicylicacid
        29
    Salicylicacid  
       2021-08-24 22:19:01 +08:00 via Android
    强推 onenote
    Maskeney
        30
    Maskeney  
       2021-08-24 22:22:52 +08:00   2
    archive.today 系列,
    archive.today
    archive.is
    archive.ph
    archive.vn
    archive.fo
    archive.li
    archive.md

    目前墙内可直接访问的域名应该是只剩 archive.vn
    WildCat
        31
    WildCat  
       2021-08-24 22:54:56 +08:00 via iPhone
    如果你用 iOS/macOS 的话,可以考虑下我们做的
    https://www.twilar.com/

    未来会出一个简化的 web 版本
    zyxk
        32
    zyxk  
       2021-08-24 23:46:42 +08:00   1


    onenote chrome 插件
    td width="48" valign="top" align="center">xz
        33
    xz  
       2021-08-24 23:51:12 +08:00 via iPhone
    有的,我记得有两款,把链接发过去就会复制一份副本,手机电脑还有 web 都有客户端
    一个叫 pocket,还有一个好像是什么 page 免费的
    kebamt
        34
    kebamt  
    OP
       2021-08-25 06:38:16 +08:00 via iPhone   1
    @WildCat 试了一下,确实很优秀!不过非苹果设备全平台有些问题,iPadOS 就用这个了,期待网页版~
    LeoSUPERB
        35
    LeoSUPERB  
       2021-08-25 09:35:13 +08:00
    SiteSucker Pro
    lio444
        36
    lio444  
       2021-08-25 09:39:42 +08:00
    @kebamt 那就是你的使用方法不对,我正常使用
    kasusa
        37
    kasusa  
       2021-08-25 10:42:59 +08:00
    从信息收集的角度来说,别人的文章不一定是最好的。
    最好的办法就是自己提取出来信息之后,自己整理一下语音然后再发布出去。比如放到 github.io 或者自己的博客。永远不会丢。
    而且这样回头看的时候也更容易看懂。毕竟是自己写的。
    jy02201949
        38
    jy02201949  
       2021-08-25 10:59:06 +08:00
    hxys
        39
    hxys  
       2021-08-25 13:05:38 +08:00
    劝你别用 webarchive, 它会被 DMCA 管制
    可以弄一个 tg 群或者某些群组,或者匿名版之类的,再或者 onion
    docx
        40
    docx  
       2021-08-25 13:10:37 +08:00
    只要文章主体的,用笔记软件的剪藏

    要求网页完整性的,用 WebArchive 类工具

    注意,如果备份不是存储在自己手里,可能有再次被删的风险
    snowfuck
        41
    snowfuck  
       2021-08-25 13:26:35 +08:00
    可以看看这个 https://github.com/go-shiori/shiori
    可以自建本地服务
    xingyuc
        42
    xingyuc  
       2021-08-26 11:44:31 +08:00
    前段时间也遇到过,只能说中文互联网环境的体验很 sb
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     948 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 19:32 PVG 03:32 LAX 12:32 JFK 15:32
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86