1 pxiphx891 2024-08-23 14:37:56 +08:00 其实我也一直想这个事,我的 nas 上也有大量电子书。我尝试过百度的 ocr ,非常准。我想,如果用 ocr 一页一页把我 nas 上的电子书都整理成文本,再接入大模型,用来问答或分类,感觉都不错,就像在 iPhone 上搜索日落,能够搜到你拍的一些照片一样,你问大模型一个问题,他能从 nas 中找到几个和你问题相关的电子书的段落 |
2 longredzzz 2024-08-23 14:53:03 +08:00 zotero + webdav |
3 ClearMoki 2024-08-23 15:00:57 +08:00 如果需要笔记可以看看 zotero |
![]() | 4 functionABC 2024-08-23 16:05:17 +08:00 zotero |
5 sumu 2024-08-23 16:14:19 +08:00 via Android 以前我也是各种折腾,现在做统一传到微信读书中了(一百多本),然后开个会员,有正版的优先用正版,还没有正版的才用下载的版本。 自带讲扫描版转电子版、听书、ai 问书都很好用 |
![]() | 6 regent 2024-08-23 16:15:09 +08:00 有能跑在 docker 上的 calibre web ,楼主可以试试看 |
![]() | 7 iambic 2024-08-23 16:16:45 +08:00 我用的是 talebook ( https://github.com/talebook/talebook ),感觉还不错 |
![]() | 8 iambic 2024-08-23 16:17:14 +08:00 电子书 talebook ,文献类 zotero |
10 itisqiang 2024-08-23 19:06:51 +08:00 刚想推荐 Zotero ,但是一看 70 个 G 的 PDF ,这可以问问爱思唯尔或者 Wiley ~ |
![]() | 11 Apol1oBelvedere 2024-08-23 21:48:34 +08:00 @iambic #8 都试过,体验如下: 1 、talebook:非常耗费资源,优化不好,对扫描类 PDF 支持不好。 2 、zotero:全量数据同步,几十 GB 内容体验也不好。 希望有一种服务器端做所有数据索引管理,客户端全量搜索,按需下载数据的是最好的。 |
12 Charlot98 2024-08-24 07:24:00 +08:00 google 的 paperpile ,可以免费试用 1 个月,可以多标签管理,做笔记,多设备实时同步。 缺点是,单个文件较大,不好同步 |
13 kingdom8 OP @Apol1oBelvedere 是的,上一次从 endnote 转出来,就是进的 zetero ,但是大文件 webdav 同步确实麻烦,所以 zetero 也弃坑了,目前常用的还是 wps 云存储,一口气开了五年 |
14 kingdom8 OP @longredzzz zotero 也用过,大量的同步也是个麻烦事 |
15 kingdom8 OP @Apol1oBelvedere 是的,甚至像 @pxiphx891 这样有 AI 付费的我也可以接受 |
![]() | 16 fuis 2024-08-24 14:17:01 +08:00 zotero + webdav |
![]() | 17 invzhi 2024-08-25 19:38:18 +08:00 Devonthink + WebDAV |
18 zealinux 2024-08-25 22:09:59 +08:00 DEVONThink 就是为这些需求而生,但是要你电脑换成 MacOS |
19 dode 2024-08-26 09:34:19 +08:00 可以开发一个简单的 Web 系统,把 pdf 逐页转为 txt 文本,导入数据库,做一个全文索引搜索功能,结果,链接跳转到指定 pdf 下载&预览 |
![]() | 22 AusardiaTx 355 天前 @zealinux devonthink 中文搜索太拉了,还得专门用 foxtrot |