今天刚买了阿里云的服务器,是 Linux 系统
现在的需求是想把自己电脑上的爬虫功能部署到服务器上,然后定时爬取数据
所以想请教下,我需要装哪些? 我只知道要装 python,其它的就不太清楚
希望有大神能够指教一下 说的越详细越好。 我可以自己去找资料,然后看下怎么弄、
1 cccp2020 2020-09-28 10:59:33 +08:00 |
![]() | 2 cherbim 2020-09-28 11:00:32 +08:00 我有个问题啊?你买的带宽不会是 1M 的吧? |
![]() | 3 cherbim 2020-09-28 11:07:19 +08:00 @cherbim 补充一点,一般需要 python3 和 pip3 就行(系统自带的 python2.7,你需要自己安装 python3 和程序依赖的库),其他的没啥了,你电脑上怎么用,服务器上就怎么用,毕竟 python 可以跨平台使用,对了,下载路径要改一下,改成 linux 格式的 定时的话你需要了解一下 crontab |
![]() | 4 lower 2020-09-28 11:09:13 +08:00 那你干嘛不买个 win 系统的主机? |
5 wzzzx 2020-09-28 11:26:45 +08:00 你自己开发的电脑是怎样的,就弄成怎样的呗 |
![]() | 6 Atukey 2020-09-28 11:29:16 +08:00 装上 python 然后用 linux 自带的定时任务就行了 服务器跑爬虫如果被封 IP 就很难受 |
![]() | 7 heiheidewo 2020-09-28 11:34:18 +08:00 记住爬数据的时候别爬太快了。谁爬我的数据爬快了就直接投毒 |
![]() | 11 herozzm 2020-09-28 12:58:40 +08:00 via Android ip 库要到位,坐牢的心态也要摆正 |
13 juziss 2020-09-29 09:41:50 +08:00 IP 长时间访问时有可能会被封的,跟敏不敏感数据没关系。有些可能会直接把云服务器的 IP 给封了,这情况你怎么处理,还有我估计你的云服务器也没多贵,你的容量估计不乐观,你考虑存储的问题吗? |
![]() | 14 wjx0912 2020-09-29 14:34:19 +08:00 scrapy |
![]() | 16 Aliyun0813 2020-10-10 13:56:29 +08:00 需要阿里云联系我呀,给你惊喜,一 66 二 333 二 666 一 |
17 yingfengi 2020-10-11 10:29:47 +08:00 via Android @Aliyun0813 续费有优惠吗 |
![]() | 18 idtaanlcoe 2020-10-12 09:25:59 +08:00 via Android vpsur 点康姆 |