1 soho176 2018-05-26 22:30:09 +08:00 抖音 app 咋抓的? |
![]() | 3 chengxiao 2018-05-26 22:33:18 +08:00 这种带加密校验的 不知道服务端加密方法的话 很难破解吧 可能只有反编译去找加密方法了 |
![]() | 4 lwj253698 OP @chengxiao 真的是加密吗。。。能不能绕过它呀 我现在看到的每一个 url 后面都是加了这几个属性的,唯独分享时的那个 url 好像没有 |
6 soho176 2018-05-26 23:00:43 +08:00 问一下站长啊,我就在本贴回复了一下,为啥我的 ip 被封了?我的联通宽带分配的固定 ip,结果现在就是无法访问了 |
![]() | 7 402124773 2018-05-26 23:02:30 +08:00 这种 app 在客户端这边也都是有加密的。例如,你抓客户端登陆,肯定不是 post 用户名和密码。而是加密后的东西。现在很多 app 大部分代码都在 so 库里面。 |
![]() | 8 playniuniu 2018-05-26 23:15:09 +08:00 via iPhone ![]() 抖音的 app 是经过加密签名的 加密函数好像在 libuser.so 里面 网上有一篇详细分析加密过程的教程 可以参考一下 |
![]() | 9 nine99 2018-05-26 23:19:00 +08:00 先用抓包工具的重放一遍那个请求看看 ,一般都是你的 python 发的请求在细节上和它原来的不一样导致的。如果 确定一样也不行,你再逆向下,看这几个参数怎么来的。 |
![]() | 10 nine99 2018-05-26 23:20:53 +08:00 实在不行就直接用 hook 的方法来爬吧。 |
![]() | 11 lwj253698 OP @playniuniu 好的!!谢谢 |
![]() | 12 lwj253698 OP @nine99 我直接赋值那个包的 url 然后用 get 方法获得 response 的 json...如果这个都不一样的话我是真的不知道还有什么可能了 |
![]() | 13 lwj253698 OP 刚刚发现一个问题,我猜抖音对指令应该是向前兼容的,也就是说有一些疑似为校验的参数貌似不赋值居然也可以... 参见 http://(hhhh)cuijiahua.com/blog/2018/03/spider-5.html/comment-page-1/#comments |
![]() | 14 lwj253698 OP = =实在是浪费了我六七个小时呢 |
15 empty9 2018-05-27 01:26:22 +08:00 之前研究过,逆向了他们 apk 实际上很简单,唯一坑的地方是有的 api 都是要求你登录,并验证 cookies。 |
![]() | 16 fange01 2018-05-27 01:27:23 +08:00 若若的问一句,是爬抖音的视频,导入其他平台做流量吗》? |
![]() | 17 patx 2018-05-27 01:33:51 +08:00 via Android 抖音我没试过,其他的视频网站只会对 url 参数做签名。 |
![]() | 18 k00baa 2018-05-27 03:26:21 +08:00 apk 逆向,然后 hook,那些参数就出来了 |
![]() | 19 locktionc 2018-05-27 08:32:36 +08:00 as,cp, mas 的算法请看这里: _rticket 只需要根据它的格式随机生成一个字符串即可,也可以省略。 |
![]() | 20 myliyifei 2018-05-27 08:50:21 +08:00 via Android 有一个人分享的抖音 url,因为名字的原因。我想从 url 分析,找到这个人的抖音 id,可以吗 |
![]() | 21 WinMain 2018-05-27 10:01:12 +08:00 github 上有一个很好用的,为了做视频分类,已经爬了十来万视频了。。 https://github.com/LoadChange/amemv-crawler |
![]() | 22 nine99 2018-05-27 10:44:10 +08:00 header 的参数设了吗 |
![]() | 23 peterpei 2018-05-27 10:46:28 +08:00 via Android @myliyifei 同样有这样的思路,借鉴了抖音 id 长度并没有发现有相同长度的 id 号,看起来是加密了。。。 |
![]() | 25 lwj253698 OP @WinMain 其实我对这个分类倒是不是太在意。。。因为我接下来还会做一些筛选,打算用 opencv 筛选出只有人像上半身的视频 |
![]() | 31 lwj253698 OP @locktionc emmm 其实我发现其实只要把这几个参数全部省略掉就可以访问了,也是很奇怪了 |
![]() | 32 KomeijiSatori 2018-05-27 15:22:16 +08:00 |
![]() | 35 bankroft 2018-06-06 20:09:45 +08:00 我的博客写过抖音全站爬虫,发不了链接,百度搜索 bankroft |
![]() | 36 wjx1993 2018-06-21 23:21:26 +08:00 为什么抖音我都抓不到包? |
37 cjcgynpu 2018-06-26 12:41:32 +08:00 嗯, 去哪儿前反爬虫工程师去了头条。 只能说这么多了。 |
![]() | 39 Trinity888 2022-05-18 13:50:29 +08:00 @lwj253698 楼主,现在抖音 App ,还能爬虫获取数据吗? |