最新活动

HOT

产品中心
服务方案
合作伙伴
关于我们

产品中心

公告文档控制台

登录免费注册

退出账号

意见箱

恒创运营部门将仔细参阅您的意见和建议，必要时将通过预留邮箱与您保持联络。感谢您的支持！

意见/建议

提交建议

所有文档

云服务器概述

区域和可用区

应用场景

使用须知/使用限制

计费说明

流量包概述

云服务器实例概述

备份概述

快照概述

存储概述

安全组概述

救援系统概述

控制台

网络概述

私有网络(VPC)概述

创建云服务器

Linux 安装宝塔面板（CentOS 8.2）

登录宝塔面板（CentOS-7.8.2003-x64-BT ）

通过 VNC 远程登录云服务器(Linux/Windows)

创建云数据盘

使用宝塔面板搭建环境

云服务器重置密码

自动续费流程及规则说明

远程桌面连接 Windows 云服务器

用远程登录软件登录 Linux 云服务器

快速入门概述

Windows 云数据盘联机

购买并挂载云数据盘

挂载云数据盘

初始化云数据盘

初始化 Windows 云数据盘（Windows 2008）

初始化 Windows 云数据盘（Windows 2016）

初始化 Linux 云数据盘（CentOS 8.0）

添加安全组规则

在安全组中放行 8888 端口

云服务器重装系统（Windows/Linux）

云服务器数据备份与还原

云服务器创建快照与还原

云服务器升级公网带宽

云服务器购买流量包

云服务器使用指南概述

开启 Windows 云服务器远程桌面协议 RDP

修改 Windows 远程端口

重装操作系统需要多长时间？

重装系统/变更规格对磁盘数据有影响吗？

创建安全组

协议类型和端口范围关系表

安全组常用端口

关联/解绑安全组实例

安全组应用案例

快照与备份的区别

绑定/解绑/换绑安全组

云服务器升级

云服务器附加IP

性能监控

Windows 云服务器防火墙添加端口

怎样开机、关机和重启云服务器？

服务器通用请求返回值

网站无法访问排查及解决办法

网络访问卡慢怎么办？

服务器 Ping 不通怎么办?

网络延迟丢包/使用Tracert测试链路

网络延迟丢包/使用MTR诊断网络问题

检查 TCP 80端口是否正常工作

无法登录Windows云服务器

美国云服务器登录太慢

保持 Windows 远程桌面长时间连接不断开

Linux 云服务器卡顿排查及解决办法

Windows 云服务器卡顿排查及解决办法

带宽占用高怎么办？

轻量云服务器概述

使用须知/使用限制

轻量云服务器流量包概述

轻量云服务器网络概述

轻量云服务器云系统盘概述

轻量云服务器实例概述

轻量云服务器计费说明

轻量云服务器备份概述

控制台

轻量云服务器快速入门概述

创建轻量云服务器

登录轻量云服务器

轻量云服务器重置密码

登录宝塔面板

使用宝塔面板搭建环境

轻量云服务器产品续费

使用SSH远程连接轻量云...

轻量云服务器使用指南概述

轻量云服务器重装系统

轻量云服务器资源监控

轻量云服务器购买并使用流...

轻量云服务器数据备份与还...

怎样开机、关机和重启轻量...

无法正常登录轻量云服务器

高防 IP 概述

计费说明

高防 IP 防护网站业务(域名接入)

创建 DDoS 高防 IP 实例

高防 IP 防护非网站业务（端口接入）

升级高防 IP 实例

高防 IP 附加弹性防护

防护概览

本地hosts临时域名访问

域名转出

域名转入

域名注册后邮件验证

域名解析多久生效

判断域名解析是否生效

CN域名解析境外主机

绑定中文域名

域名解析

登录域名面板解析域名

域名续费和删除规则

域名续费流程

域名命名规则和建议

域名注册

怎么ping域名

判断域名DNS是否稳定

域名DNS不稳定处理方法

添加邮箱MX解析

自助域名取回/域名找回

域名/网站无法访问的原因排查

域名过期后怎样续费？

域名进入赎回期无法续费怎么办？

修改FTP密码

怎样查看主机信息

云虚拟主机新建数据库

云虚拟主机删除数据库

云虚拟主机修改数据库密码

云虚拟主机下载数据库

云虚拟主机数据库过大如何导入

云虚拟主机导入数据库

云虚拟主机清空数据库

云虚拟主机导出数据库

云虚拟主机修改面板密码

怎样登录主机管理面板/DA面板

子目录/子域名建网站

在线/面板上传文件

php主机网站根目录介绍

新用户必看(云虚拟主机)

在线购买云虚拟主机

云虚拟主机数据库phpMyAdmin管理

PHP版本切换方法

新建FTP账户

网站发布流程/建站流程

安装第三方SSL证书/安装已申请的SSL证书

免费获取SSL证书/一键安装SSL证书/https加密

快速删除或清空网站程序

查看主机容量流量情况

查看当日完整日志情况

一键还原网站数据

PHP主机防盗链方法

用.htaccess屏蔽IP方法

DirectAdmin面板更改网站默认首页

网站设置301跳转的方法

查看本月额外附加的流量

云虚拟主机购买/使用流量包

下载并查看云虚拟主机日志

一键备份网站数据

设置网站404错误页面

更换域名绑定/主机绑定

在线压缩文件

一个主机建多个网站

多个域名访问同一个网站

在线解压（zip/tar.gz)

网站流量超标的解决办法

如何升级主机型号

云虚拟主机远程连接数据库

云虚拟主机如何限制单个域名的流量、磁盘

怎样自助重置主机/重开主机？

http自动跳转到 https 的设置方法

一键切换数据中心/重置主机

独立IP被其他域名解析

服务器禁ping的原因

误删虚拟主机系统文件

登录FTP提示错误530

共享IP被攻击，网站打不开，怎样升级独立IP

网站Internal Server Error/suPHP/500错误

安装SSL后，地址栏图标出现警告三角形

DedeCMS搬家DedeCMS Error Warning!错误

打开网站空白/500 错误（查看错误日志）

网站风险/网站包含恶意软件/提示危险网站

云虚拟主机被爬虫访问耗费大量流量的解决方法

云虚拟主机网站无法访问解决方法

提交工单/创建工单

注册会员账号

修改会员账户个人信息

修改会员账户密码

修改会员邮箱

查看工单

激活推广联盟

找回会员账户密码

账户邮箱/手机收不到验证码

如何退订邮件？

推广联盟规则说明

查看账单

如何支付账单

账户充值

产品如何续费

退款流程及相关说明

现金券使用规则和方法

使用余额付款

在线付款/订单支付流程及说明

怎样查看消费明细？

是否可以用现金券续费？

现金券使用后是否可以退换？

产品手动续费

产品自动续费

恒创科技信息安全管理总则

法律声明

隐私政策

SLA 协议

恒创科技产品测试 IP 汇总

恒创科技服务协议

恒创科技产品安全违规处理规则

wordpress实现301跳转

wordpress谷歌字体访问慢

wordpress设置伪静态

wordpress安装教程

wordpress搬家

wordpress搬家后内页打不开

wordpress更换域名

WordPress怎样利用SMTP发邮件

每月流量是什么意思

织梦问题网站处理

站点异常/资源滥用处理办法

加速乐特别说明

问题站点处理方案

Flashfxp下载及使用

删除不需要的产品

Flashfxp被动主动切换

流量异常消耗

活动通知/找回密码收不到邮件怎么办

织梦报错Please set request_order解决办法

详细Discuz安装教程

怎样自助关机开机重启服务器？

Plesk控制面板安装方法

《计算机信息网络国际联网安全保护管理办法》（公安部33号令）

《关于办理网络赌博犯罪案件适用法律若干问题的意见》

《互联网站禁止传播淫秽、色情等不良信息自律规范》

《关于加强互联网易制毒化学品销售信息管理的公告》

《互联网危险物品信息发布管理规定》

《全国人大常委会关于维护互联网安全的决定》

《互联网视听节目服务管理规定》（国家广播电影电视总局、信息产业部令第56号）

《关于办理利用信息网络实施诽谤等刑事案件适用法律若干问题的解释》

《非经营性互联网信息服务备案管理办法》(信息产业部令第33号)

《教育网站和网校暂行管理办法》（教育部教技［2000］5号）

《全国人民代表大会常务委员会关于加强网络信息保护的决定》

《关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》

《互联网药品信息服务管理办法》（国家食品药品监督管理局局令第9号）

《互联网医疗保健信息服务管理办法》（中华人民共和国卫生部令第66号）

《互联网新闻信息服务管理规定》（国务院新闻办公室、信息产业部令第37号）

《关于审理利用信息网络侵害人身权益民事纠纷案件适用法律若干问题的规定》

《关于办理利用互联网制作、复制、出版、贩卖、传播淫秽电子信息刑事案件法律的解释》

《互联网用户账号名称管理规定》

《互联网药品信息服务管理暂行规定》

《互联网电子公告服务管理规定》

《互联网站管理工作细则》

《互联网信息服务管理办法》

中华人民共和国文化部令（第49号）

产品转出/转移产品到其他帐户/多账户产品转移

云虚拟主机被爬虫访问耗费大量流量的解决方法

来源：恒创科技编辑：恒创科技编辑部

2021-11-15 14:45:05

问题描述

　　用户使用虚拟主机搭建的网站被爬虫访问，耗费大量流量和带宽的处理方法。

解决方案

　　在站点根目录下创建 robots.txt文件，robots.txt 文件是网站的一个文件，搜索引擎抓取网站数据时，首先就是抓取的该文件，根据里面的内容决定对网站文件访问的范围。它能够保护我们的一些文件不暴露在搜索引擎之下，从而有效的控制爬虫的抓取路径。

　　说明：robots 协议也叫 robots.txt，robots 协议不是强制协议，部分搜索引擎或者伪装成搜索引擎的爬虫不会遵守该协议，对于不遵守该协议的情况，以下方法无效。

　　根据更多信息中的搜索引擎和其对应的 User-Agent，Robots.txt 代码样例如下所示：

　　• 禁止所有搜索引擎访问网站的任何位置。

  User-agent:  Disallow: /

　　• 允许所有的搜索引擎访问网站的任何位置。

　　User-agent:　　Disallow:

　　• 仅禁止Baiduspider搜索引擎访问您的网站。

   User-agent: Baiduspider　　Disallow: /

　　• 仅允许Baiduspider访问您的网站。

    User-agent: Baiduspider　　Disallow:

　　• 禁止spider搜索引擎访问特定目录。

   User-agent: *　　Disallow: /cgi-bin/　　Disallow: /tmp/　　Disallow: /data/

说明：特定三个目录需要分别并列写。请注意最后需要带斜杠。

　　• 允许访问特定目录中的部分URL，实现a目录下只有b.htm允许访问。

    User-agent: *　　Allow: /a/b.htm　　Disallow: /a/

搜索引擎
AltaVista	Scooter
baidu	Baiduspider
Infoseek	Infoseek
Hotbot	Slurp
AOL Search	Slurp
Excite	ArchitextSpider
Google	Googlebot
Goto	Slurp
Lycos	Lycos
MSN	Slurp
Netscape	Googlebot
NorthernLight	Gulliver
WebCrawler	ArchitextSpider
Iwon	Slurp
Fast	Fast
DirectHit	Grabber
Yahoo Web Pages	Googlebot
LooksmartWebPages	Slurp