询问薪资水平基本上 v 站每周一贴,所以我把我做的这个分享下吧。
起因是大学毕业的时候不知道去哪个城市,然后就写了一个爬虫,爬去了 51,智联的招聘和链家的房价,然后做了一些分析。
github 地址 https://github.com/jiangwei1995910/getAwayBSG
主页里面按工作年限统计了各城市平局薪资和标准差,也根据房价薪资计算了各城市的买房难度。
最后,我在考虑是否提供数据下载,但是我看别人爬虫都没提供数据下载,这是有法律风险吗?
![]() | 1 GordianZ 2019-07-24 12:21:39 +08:00 移动到 /go/create 了。 突然觉得武汉也没那么烂了。 |
![]() | 2 jydeng 2019-07-24 12:40:07 +08:00 ![]() 厦门果然厉害 |
3 micean 2019-07-24 12:41:12 +08:00 平均薪资确实没啥意义,如果能按薪资的下限统计各个薪资区间的个数应该会更有帮助一些 |
![]() | 4 LXchienne 2019-07-24 12:45:05 +08:00 via Android 感谢,给飘着的人一些参考 |
5 feb30th 2019-07-24 13:01:39 +08:00 via Android 没有福州 |
![]() | 6 Cellei 2019-07-24 13:01:54 +08:00 这个不错啊 |
![]() | 7 Cellei 2019-07-24 13:05:14 +08:00 啊,没有天津啊 |
8 avalon8 2019-07-24 13:25:25 +08:00 ![]() 看了小姐姐的头像 真好看啊 |
![]() | 9 Bonky 2019-07-24 13:32:13 +08:00 via iPhone 长沙是真的好...工资不算低,然后房价基本上一万出头 |
10 SeaRecluse 2019-07-24 13:43:35 +08:00 坐标厦门,比真实感官还是差点。 |
![]() | 11 julypanda 2019-07-24 13:46:09 +08:00 小姐姐真好看 |
12 AutumnVerse OP |
![]() | 13 luoway 2019-07-24 13:53:14 +08:00 “另外,除了平均,还有什么可以统计的吗?” 阶梯吧,比如在某个取值范围里,有多少数据 |
![]() | 14 luoway 2019-07-24 13:54:28 +08:00 另外需要一个薪资房价比值图,直观感受下哪些城市压力小 |
![]() | 15 askfilm 2019-07-24 13:55:08 +08:00 @jiangwei2222 你统计招聘网站的薪资时, 有没有注意这个实际问题呢: 比如招聘月薪标注未 5K~10K , 实际实际上只会给 5K~7K ( 7K 都有点高看了) |
![]() | 16 Cellei 2019-07-24 14:00:23 +08:00 @jiangwei2222 天津太没存在感,前 30 都进不了 |
17 AutumnVerse OP @askfilm #15 我取值是 5-10 的中间值,取 7.5k |
18 AutumnVerse OP @Cellei #16 https://jiangwei1995910.github.io/getAwayBSG/post/job.html 薪资里面是有天津的 @luoway #14 不是有了吗?我计算的是(月薪 /每平米房价)的倒数 |
![]() | 20 silverbooker 2019-07-24 14:06:47 +08:00 还可以考虑用中位数。 |
![]() | 21 askfilm 2019-07-24 14:08:41 +08:00 @jiangwei2222 实际上来说取薪资中间值是绝对不准确的, 偏左边薪资比较准 |
![]() | 22 mmrx 2019-07-24 14:08:50 +08:00 不错不错,star 了 |
23 retur 2019-07-24 14:10:43 +08:00 希望在薪资上修正一下,的确好多薪资都是乱标的,另外怎么没有天津啊,虽然天津互联网不行。 |
24 zjlletian 2019-07-24 14:19:45 +08:00 (月薪 /每平米房价)的倒数值, 直接说 每平米房价 /月薪 不好么。。。 |
![]() | 25 zdkmygod 2019-07-24 14:32:24 +08:00 有点知道为什么和直观感受不符合了,因为智联招聘限制了只能查看 12 页数据。于 14.30 分查看的,同样是 java 岗位的 12 页数据,北京最早的一条招聘信息的更新时间是 11.52 ,武汉的更新时间是 09.15 ,这之间的区别有多大,我想大家应该都能了解吧。 |
27 rorschach214 2019-07-24 15:02:42 +08:00 小姐姐真好看 |
![]() | 28 lynnlee 平均一般不太靠谱,取中位数试试 |
![]() | 30 lizz666 2019-07-24 15:40:09 +08:00 star 了 |
![]() | 31 hlayk 2019-07-24 16:39:49 +08:00 因此我使用了(月薪 /每平米房价)的倒数值来表示一个城市的生活成本 |
![]() | 32 zw1027 2019-07-24 18:00:16 +08:00 小姐姐真好看 |
33 wugn 2019-07-24 18:37:53 +08:00 via Android 厦门房价这么低?你肯定把岛外也当成厦门了 |
34 way2create 2019-07-24 20:11:37 +08:00 有句话怎么说开着 a-b 取 a |
![]() | 35 KINGOD 2019-07-24 20:17:52 +08:00 诶哟,楼主是廊坊人嘛?居然把这么个小城,跟那些大城市们放到一起掰手腕。 |
37 clandyuki 2019-07-25 11:04:59 +08:00 能不能加个工作年限 x 学历 x 地域的薪酬表呢 |
38 AutumnVerse OP |
![]() | 39 linxiaoziruo 2019-07-25 15:32:14 +08:00 这么一看,杭州挺不错的 |
![]() | 40 Chenxiaolannnnn 2019-07-25 15:47:35 +08:00 求福州的数据 |
41 AutumnVerse OP 3-5 年工作经验 { "_id" : { "name" : "福州", "code" : "681" }, "count" : 735.0, "avg" : 12713.5343618513, "std" : 6645.36207874749, "ratio" : 0.522699816558312 } 1-3 年工作经验 { "_id" : { "name" : "福州", "code" : "681" }, "count" : 1181.0, "avg" : 8959.8106714206, "std" : 3071.06914847239, "ratio" : 0.342760495851579 } 房价 { "_id" : "福州", "count" : 8540.0, "avg_UnitPrice" : 25427.8824355972, "std" : 9704.20947735177, "ratio" : 0.381636555931475 } @Chenxiaolannnnn #40 |
![]() | 42 mengshiilee 2019-07-26 14:56:21 +08:00 大为老师代码写得好啊 |
43 wangkai0351 2019-07-26 16:49:28 +08:00 @mengshiilee 老哥说说代码哪里好,或者你认为哪个细节精妙 |
![]() | 44 mengshiilee 2019-07-26 17:28:25 +08:00 @wangkai0351 我就是稍微夸一下,重点是点出蒋老师的名字,唉。。。 |
45 wangkai0351 2019-07-26 17:29:53 +08:00 @mengshiilee 是我自己太刚了,因为没看出爬虫和数据库接口的精妙之处。 |
46 HiJony 2019-07-28 14:19:44 +08:00 这么一看,成都优势很大啊 |