1 oska117 2018-06-20 11:16:54 +08:00 via Android 不错,谢谢分享,研究一下 |
![]() | 3 isevenfox 2018-06-20 14:23:19 +08:00 star 一波~ 感谢 |
5 freemagico 2018-06-20 22:38:29 +08:00 已 star,请问爬虫是从哪里爬磁链的? |
![]() | 6 lueying OP @freemagico 这里是磁链到爬虫脚本 是加入 DHT 网络 获取到 hashinfo 附上 js 脚本地址 可以瞅瞅 跑跑试试 https://github.com/ssstk/manget2torrent/blob/master/src/spider/index.js |
7 hezhile 2018-06-21 10:03:05 +08:00 ![]() 搜索结果的排序依据是什么呢? 可以按照收录日期排序码? |
![]() | 8 lueying OP @hezhile 现在是 Elasticsearch 的自己查询的排序 现在正在添加最新收录排序 有问题欢迎建[issue]( https://github.com/ssstk/findcl/issues)交流。哇哈哈 |
![]() | 9 lueying OP github issue 地址 https://github.com/ssstk/findcl/issues |
![]() | 11 wanwan 2018-06-22 15:50:51 +08:00 这类网站比较多啊。 |
![]() | 13 artandlol 2018-06-23 08:27:13 +08:00 via iPhone Docker 化的项目更受欢迎 |
![]() | 16 Desiree 2018-06-23 14:54:02 +08:00 请问这些数据是从哪里来的? |
![]() | 17 lueying OP @Desiree 是加入 DHT 网络 获取到 hashinfo 再解析 hsahinfo 获取 BT 种子信息 可以了解下 BitTorrent 协议 这里是磁链到爬虫源码 https://github.com/ssstk/manget2torrent/blob/master/src/spider/index.js |
![]() | 19 lueying OP @duola ES 团队不推荐完全采用 ES 作为主要存储,缺乏访问控制还有一些数据丢失和污染的问题。ES 没有事务,而且是近实时。成本也比数据库高。但是它的优势在于索引后,方便搜索,这是 mongodb 等数据库干不了的。 所以,搜索的时候使用 Elasticsearch,进入具体的资源页面,就直接从 mongodb 里取数据。 当然 小项目玩玩 用什么感觉都无所谓了~ |
![]() | 22 jinzhe 2018-06-26 15:40:56 +08:00 搜索了下“藏” |