【Js逆向】书链爬虫 逆向分析

说明

原本很久没有看书链,这次又有学生找到博主,博主又看来一下,仅做思路分析没有具体实现,希望能对大家有帮助,不要拿去做非法的事,仅作为参考学习交流

抓包分析

发现有三个 异常值 (需要引起注意的值),发现只要访问一次失效了,貌似还有失效,而且还很短

mark

追栈

通过调用栈,追到这 auth_key key1 key2 三个值生成的地方,具体是怎么来的,代码很明确的,就不过多的赘述

mark

页面链接

找到了 加密值的来源,那么这些 页面的链接来自什么地方,这就是我们现在的任务。接下还是追栈

发现一个 allPage 的变量名,这里面存在所有的页面链接

mark

然后搜索上下文,发现此处是 allPage的赋值处,接着向上看到 解密处,断点调试,发现想要的值
mark

sign 值

接下来看 这些加密数据是怎么来的,发现请求这个链接需要的参数还挺多的,继续进入 requestSign() 函数,查看细节

mark

发现 sign 其实是 提交数据组成的字符串,计算 MD5 值后转大写,这里有个巧可以取,想想后端该怎么验证不可逆的 MD5

mark

测试爬取

发现有些不完整,这里就不能发怎么处理了,只看看效果就好

mark

处理后都是完整的
mark

发表评论 / Comment

用心评论~

金玉良言 / Appraise
哈哈哈LV 1
2023-06-27 00:19
麻烦问下,书链的所有试卷列表从哪里可以获取?