什么是百度高级语法
创造高级语法的初衷是帮助用户提高搜索结果的准确性,不过后来因为百度蜘蛛收录到了一些不该收录而且影响web安全的页面,使用百度语法也就慢慢变味了,类似于Google Hacker
常用的四个百度高级语法
第一、Site
Site一般用于把搜索结果限制于某一个网站中。
site:toutiao.com
site命令可以帮助seo优化工作者了解所优化的网站收录情况,如下图
这里可以看到,头条收录数为18万3千条。
第二、inurl
inurl命令一般用于限制于搜索结果中的链接。
inurl语法可以和site组合使用
site:toutiao.com inurl:system
表示只在toutiao.com网站中搜索url链接带system的收录页面
第三、intitle
intitle语法限制搜索结果标题,不过此语法一般都是组合使用,单独使用如下:
intitle:头条号
组合使用如下:
inurl:weixin.qq.com intitle:api接口
便能很轻松找到api接口文档说明
第四、filetype
filetype限制搜索结果必须出现在文档中
filetype:xls
便能找到很多表格文档
组合为hack语法
inurl:admin&index intitle:无标题
访问即越权操作,无需登录
site:.cn inurl:oa
便能收集到很多敏感信息。还有很多组合我就不一一举例了
防范被百度蜘蛛收录到敏感页面的方法
假设发现自己的后台地址被收录了
我们可以点击快照进行申请删除
理由就是站长不希望被收录敏感页面,望删除,一般第二天就删除了
第二种
建立robots.txt进行防范,不过我觉得robots文件有点矛盾
假设你不希望收录admin页面,你在robots.txt里加入admin。那么攻击者便可以查看robots文件得到后台地址
各位觉得哪种方法比较好呢?