【道客巴巴 豆丁网】爬虫逆向一键下载软件 x 油猴脚本

【道客巴巴 豆丁网】爬虫逆向一键下载软件 x 油猴脚本
Prorise1. [必读] 写在前面:新旧下载方案共存指南
摘要: 大家好,我是 Prorise。为了应对各网站规则的频繁变动,我的下载工具也在不断进化。目前,我们有 “传统软件” 和 “新版方案 (推荐)” 两种工具并存。这篇指南会为您提供所有方案的获取方式,并 强烈推荐您优先使用新的解决方案 来获得最佳的下载成功率和体验。
1.1. 传统集成软件下载 (已停止维护)
这是我早期制作的,将道客巴巴和豆丁网下载功能集成在一起的软件。
请注意:由于网站风控升级,这个版本 不再更新,可能会频繁遇到 下载失败、下载不完整 等问题。它仅作为备用选项提供。如果您是新用户,强烈建议您直接跳过此节,阅读后续的“新版方案”。
下载链接:
1 | https://pan.baidu.com/s/175ys6Mq2M0yPoZ1hvIOA8w?pwd=6666 |
提取码:6666
1.2. 为何推出新版方案?
为了解决传统软件的种种不稳定问题,我针对两个网站开发了全新的、独立的解决方案:
- 针对道客巴巴: 我采用全新的 油猴脚本 方式。它直接在您的浏览器里工作,兼容性最好,成功率也最高。
- 针对豆丁网: 我为您准备了其他作者开发的,同样也能够完整下载的油猴脚本作为推荐
接下来的内容,将手把手教您如何使用这两个 推荐方案。
2. [必看] 文档下载终极解决方案:油猴脚本
“油猴脚本”听起来可能很复杂,但请相信我,它比安装一个不熟悉的软件要简单得多!您只需要给您的浏览器装一个小小的“增强插件”即可。
2.1. 第一步:安装“油猴”浏览器扩展
油猴 (Tampermonkey) 是一个非常流行的浏览器扩展程序,它可以让我们在浏览器上运行一些自定义的“小脚本”,来实现网页上原本没有的功能(比如添加一个下载按钮)。- 打开浏览器扩展商店。
- 对于 Edge 浏览器,请访问:Microsoft Edge 加载项
* 对于 Chrome 浏览器,由于网络原因可能无法直接访问,您需要想办法进入 Chrome 网上应用店。
- 将篡改猴固定到快捷栏
如图所示,将篡改猴固点击灰色标签固定到快捷栏,且点击管理拓展进入到下一步
- 确保开发者模式开启
2.2. 第二步:安装“道客巴巴下载”专属脚本
浏览器有了“油猴”这个强大的基础工具后,我们现在来安装我为您编写的专属脚本。
- 请复制以下完整链接,并到浏览器地址栏中打开,进入脚本安装页面,如果您是有梯子的状态,这一步就可以自动安装了
1 | https://update.greasyfork.org/scripts/481288/%E7%99%BE%E5%BA%A6%E6%96%87%E5%BA%93%E4%B8%8B%E8%BD%BD%E5%99%A8-%E6%94%AF%E6%8C%81%E7%99%BE%E5%BA%A6%E6%96%87%E5%BA%93%E3%80%81%E6%B7%98%E8%B1%86%E7%BD%91%E3%80%81%E8%B1%86%E4%B8%81%E7%BD%91%E3%80%81%E9%81%93%E5%AE%A2%E5%B7%B4%E5%B7%B4%E3%80%81%E5%8E%9F%E5%88%9B%E5%8A%9B%E6%96%87%E6%A1%A3.user.js |
- 在打开的页面中,点击那个绿色的 “安装此脚本” 按钮。
- 油猴扩展会弹出一个确认窗口,再次点击 “安装” 按钮即可。
如果您点击后发现他跳转没有响应,那么我们就需要手动的给他添加到我们的油猴脚本里
2.3. 第三步:开始下载!
现在,一切准备就绪!
- 请 完全关闭 您的浏览器,然后重新打开。
- 访问任意一个您想下载的道客巴巴文档页面。
- 您会惊喜地发现,在页面的左侧,出现了一个新的操作按钮,点击它,然后选择您需要的操作即可开始处理。
2.4. 道客巴巴脚本常见问题 (FAQ)
以下的场景问题是只针对于道客巴巴文献下载器的回答,油猴脚本一般不会有任何问题
我下载下来的东西提示 gif..
异常或者图片不显示怎么办?
这是最常见的问题!主要有两个原因:
原因一: 请检查您保存文件的电脑路径(也就是文件夹名字)是不是包含了中文。脚本对中文路径的支持不太好,请尝试将文件直接保存到 D 盘或 E 盘根目录,或者一个纯英文的文件夹下。
原因二: 如果路径已经是英文了还是不行,那可能是编码问题,或者你想要爬取的文章页数已经超过了 900 页以上了,这种情况比较复杂。不过,脚本提供的是页面截图抓取,理论上不会有格式异常。请确保您使用了最新版的脚本。
明白了,我先试试改成英文路径!
3. [核心] 豆丁网下载问题专项解决方案
请注意:对于豆丁网,请 不要 使用上面的油猴脚本。由于豆丁网的机制不同,我为您提供了另外一个油猴脚本
3.1. 获取新油猴脚本
- 通过下方链接下载油猴脚本。请复制链接后在浏览器中打开, 如果您是有梯子的状态,这一步就可以自动安装了,同样的,我也提供了一个手动安装的版本,我们可以按
2.2
章节的手动安装步骤来手动安装
以下的是自动安装的脚本,直接复制进浏览器里即可(前提是你得挂梯子)
1 | https://update.greasyfork.org/scripts/486211/%E3%80%90%E6%9C%80%E5%BC%BA%E6%97%A0%E5%A5%97%E8%B7%AF%E8%84%9A%E6%9C%AC%E3%80%91%E4%BD%A0%E8%83%BD%E7%9C%8B%E8%A7%81%E5%A4%9A%E5%B0%91%E6%88%91%E8%83%BD%E4%B8%8B%E8%BD%BD%E5%A4%9A%E5%B0%91%E4%B8%8B%E8%BD%BD%E5%85%AC%E5%BC%80%E5%85%8D%E8%B4%B9%E7%9A%84PPT%E3%80%81PDF%E3%80%81DOC%E3%80%81TXT%E7%AD%89%E6%96%87%E4%BB%B6.user.js |
- 下载后解压,您会看到软件程序。
3.2. 豆丁网软件常见问题 (FAQ)
大佬,为什么我的文档总是只能下载一半?
这是豆丁网最核心的问题!99% 的可能性是因为你没有按照我的建议操作。
首先你更应该尝试一下我们的的新解决方案,使用油猴脚本下载
好的好的,我去翻一翻上面的教学跟着做
软件提示“没有检测到 SID”是什么意思?
在之前的时候可以通过登录来解决这个问题,现在无论如何尝试登录都会导致失败,所以豆丁网的下载可能难以维护了,建议改用油猴脚本
4. [通用] 软件通用问题与联系方式
这里整理了一些所有工具都可能遇到的通用问题和最终的求助方式。
我一打开软件就提示 HTTP
什么的错误,怎么办?
这个问题通常是因为你开了“梯子”或者其他的网络代理。
解决方案:请把这类代理软件完全关闭,然后再重新启动我的下载工具,一般就能解决。
还有,我的电脑打不开你的软件,一点反应都没有。
请确认一下你的操作系统。我的工具目前只支持 Windows 10 和 Windows 11 系统。
如果你是 Win7 系统,需要自己去安装配置 Python 环境,过程对小白来说非常复杂,所以不太推荐。
博主,你分享的百度网盘链接是不是失效了?提示我文件取消分享了。
链接是有效的!请你仔细看一下我分享的文字,链接里是不是多出了像“去掉文字”这样的中文提示?
解决方案:把这些多余的汉字从链接里手动删除掉,再复制到浏览器里打开就可以了。
上面所有的方法我都试过了,还是不行,真的没办法了吗?
如果确实遇到了无法解决的疑难杂症,可以加我的微信。
微信号: Prorise7896
如果这篇教程和工具最终帮助到了您,希望您能回 B 站给我一个 一键三连 并在评论区 留言成功,这是对我最大的鼓励和支持,谢谢大家!