有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
Elaina
V2EX    程序员

有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢?

  •  1
     
  •   Elaina 2022-11-15 19:22:40 +08:00 3203 次点击
    这是一个创建于 1125 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在越来越多的内容被审核给和谐掉,或者某个网站域名更换无法找到了,有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢?

    或者说开发一个剪藏系统应该以一个什么样的思路呢?

    23 条回复    2022-11-17 20:47:54 +08:00
    cmdOptionKana
        1
    cmdOptionKana  
       2022-11-15 19:35:07 +08:00   1
    浏览器插件 SingleFile
    hamsterbase
        2
    hamsterbase  
       2022-11-15 20:37:46 +08:00 via iPhone   2
    1. 用 singlefile 保存 html
    2. safari 右键另存为 webarchive
    3. chrome 右键另存为 mhtml

    这三种格式都能完美的保存 css ,图片 ,html 。

    hamsterbase 支持导入这三种格式的网页。 导入后支持以下功能

    1. 完美渲染,

    2. 支持在网页上批注做笔记。

    3. 全文搜索

    4. 根据条件筛选

    5. 筛选后以 rss 输出
    afutureus
        3
    afutureus  
       2022-11-15 20:59:15 +08:00 via iPhone   2
    保存为 pdf 。

    之前试过 n 种办法,最后用 safari 的 导出为 pdf 解决了。导出的 pdf 是一个完整无分页的。
    Garasu
        4
    Garasu  
       2022-11-15 21:09:11 +08:00
    群晖的 note 有个 chrome 的插件,能把网页收藏到 note 里,可以选择简化内容 完整内容 整个页面屏幕截图 屏幕截图 四种。
    除了群晖的 note ,一些笔记软件也有这个功能。
    DIO
        5
    DIO  
       2022-11-15 21:46:26 +08:00
    我折腾过很多方案。SingleFile is best
    某象笔记 做笔记的话 也不错,但是收费。
    chrome 另存 pdf 保存不够完整。

    另外还听说过 server 方案,把浏览的网页全部保存,有点心动,但是种种原因还是没尝试
    crysislinux
        6
    crysislinux  
       2022-11-5 22:42:53 +08:00 via Android
    要说方便的话还是得那些笔记软件出的浏览器插件。
    hamsterbase
        7
    hamsterbase  
       2022-11-15 23:14:53 +08:00
    @DIO

    试试看我?

    1. 支持在 nas 上部署 https://hamsterbase.com/zh/docs/install/synology.html
    2. 支持自动导入文件夹下的全部网页。 你之前 singlefile 保存的网页可以全部导入。https://hamsterbase.com/docs/importing-website.html#automatic-importing
    3. 支持绑定 singlefile 插件,一键导入。https://hamsterbase.com/zh/docs/integrations/singlefile.html
    edis0n0
        8
    edis0n0  
       2022-11-15 23:17:05 +08:00
    Ctrl+P 打印为 PDF ,虽然不能搜索不能复制但能保证不会引用外部内容,内容永远不会变
    agagega
        9
    agagega  
       2022-11-15 23:23:52 +08:00 via iPhone
    最完美的方案应该还是逐站进行优化(大部分内容其实都来自那几十个国内外知名网站,剩下的个人博客是很好直接从 html 抓的)。直接保存请求得到的 html 肯定不行,因为很多网站要用 ajax 做渲染,至少得保存渲染完之后的内容
    hamsterbase
        10
    hamsterbase  
       2022-11-16 00:46:03 +08:00
    @agagega

    如果不是批量爬虫,手动保存网页,那么 singilefile 、浏览器自带的快照会更合适一点。ctrl + s 就存下来了。
    此时保存的是 ajax, 前端框架渲染后的页面。 只需要把当前的 css 、html 、图片 存下来。 基本上保存前怎么样,保存后就是怎么样。 甚至可以 翻译、去广告之后再保存。


    如果要批量保存 url ,可以试试看 singlefile 自带的保存功能。

    1. 安装 singilefile
    2. 右键 -> singilefile -> Batch save URLS...
    CaspianJou
        11
    CaspianJou  
       2022-11-16 00:52:06 +08:00
    Cubox 有快照
    rpish
        12
    rpish  
       2022-11-16 00:54:59 +08:00
    cubox/inoreader
    WebKit
        13
    WebKit  
       2022-11-16 01:06:12 +08:00 via Android
    笔记插件,直接截图保存
    efaun
        14
    efaun  
       2022-11-16 01:24:56 +08:00
    Webrecorder
    CSGO
        15
    CSGO  
       2022-11-16 09:16:40 +08:00
    @cmdOptionKana SingleFile 和 Save Page WE 有什么区别?两个我同事保存同一个大网页,一个 20mb ,一个 15mb 。
    xiang0818
        16
    xiang0818  
       2022-11-16 09:34:49 +08:00
    有道云笔记插件了解一下
    cmdOptionKana
        17
    cmdOptionKana  
       2022-11-16 09:39:00 +08:00
    @CSGO 没用过 Save Page WE, 看起来也很不错
    Jacobson
        18
    Jacobson  
       2022-11-16 10:56:04 +08:00
    save as mht
    lxxself
        19
    lxxself  
       2022-11-17 10:24:33 +08:00
    @hamsterbase 有点东西,试了试,功能满足。不过 hamsterbase 前端交互一般般,搜索部分也搜不到。不过确实还不错了,打算试一段时间
    hamsterbase
        20
    hamsterbase  
       2022-11-17 12:12:43 +08:00 via iPhone
    @lxxself

    非常欢迎加微信详聊, 一起优化交互。

    目前有一个搜索优化的版本,我可以私聊发给你。
    hamsterbase
        21
    hamsterbase  
       2022-11-17 12:13:20 +08:00 via iPhone
    @lxxself

    软件官网有微信,还有 telegram 的联系方式。
    lxxself
        22
    lxxself  
       2022-11-17 19:34:04 +08:00
    @hamsterbase 卧槽,没细看昵称,原来就是官方啊。有官方群聊么
    hamsterbase
        23
    hamsterbase  
       2022-11-17 20:47:54 +08:00 via iPhone
    @lxxself

    https://hamsterbase.com/zh/docs/support.html

    telegram 群和微信群都有。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1060 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 86ms UTC 23:51 PVG 07:51 LAX 15:51 JFK 18:51
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86