沃梦达 / 编程技术 / 服务器 / 正文

Referer等错误码处理-爬虫反扒机制处理

沃梦达教程服务器

2022-12-16

HTTP来源地址（referer，或 HTTP referer）是HTTP表头的一个字段，用来表示从哪儿链接到目前的网页，采用的格式是URL。换句话说，借着HTTP来源地址，目前的网页可以检查访客从哪里而来，这也常被用来对付伪造的跨网站请求。网站里面常常会用到这

HTTP来源地址（referer，或 HTTP referer）是HTTP表头的一个字段，用来表示从哪儿链接到目前的网页，采用的格式是URL。换句话说，借着HTTP来源地址，目前的网页可以检查访客从哪里而来，这也常被用来对付伪造的跨网站请求。网站里面常常会用到这个属性来对爬虫进行限制，比如之前我们尝试的爬虫案例中就有针对下载时的referer处理

当你傻愣愣的去访问页面时，往往会返回这样的错误信息页面

这里因为有关键字referer所以大家可能很快就能够判断出问题所在然后针对性做处理，但是更多时候往往会出现一些我们没遇到过的情况，，比如IP黑名单，Token防盗链等等，我们可以去CDN 默认错误码寻找常见的错误码信息，然后找到问题再针对解决，这里举一些常见的错误对应CDN

比如之前的referer我们发现的错误所在，然后直接在对图片的下载过程中对referer进行设置即可（这里直接将当前链接赋给referer）

Referer 错误码

沃梦达教程

本文标题为：Referer等错误码处理-爬虫反扒机制处理

上一篇： Docker系列学习之Swarm mode管理节点常用命令详解

下一篇：教你突破基于HTTP_REFERER的防盗链的方法

基础教程推荐

学习Bootstrap5

猜你喜欢

linux之conda环境安装全过程 2023-07-11
实战Nginx_取代Apache的高性能Web服务器 2023-09-29
linux下安装apache与php;Apache+PHP+MySQL配置攻略 2023-08-07
nginx.conf(centos7 1.14)主配置文件修改 2023-09-23
Apache服务器配置攻略3 2022-09-01
服务器添加git钩子的步骤 2022-12-12
centos 7 安装及配置zabbix agent 2023-09-24
apache和nginx结合使用 2023-09-10
Apache Hudi数据布局黑科技降低一半查询时间 2022-10-06
IIS 6 的 PHP 最佳配置方法 2022-09-01