百独托管7500 紫田网络超高转化播放器收cps[推荐]速盾CDN 免实名免备防屏蔽阿里云 爆款特卖9.9元封顶提升alexa、IP流量7Q5团队
【腾讯云】中小企福利专场【腾讯云】多款产品1折起高防 随时退换 好耶数据小飞国外网赚带你月入万元炎黄网络4H4G10M 99每月
香港带宽CN2/美国站群优惠中客数据中心 服务器租用联盟系统移动广告平台 中易企业专场腾讯云服务器2.5折九九数据 工信部正规资质
腾讯云新用户大礼包代金券高价收cpa注册量高价展示【腾讯云】2核2G/9.93起租服务器找45互联 随时退换阿里云 短信服务 验证秒达

织梦dedecms robots.txt详细设置方法 [复制链接]
查看:4824 | 回复:5

107

主题

328

帖子

244

积分

落伍者(一心一意)

Rank: 1

贡献
160
鲜花
0
注册时间
2013-10-11

落伍微信绑定QQ绑定落伍者落伍手机绑定

发表于 2013-10-21 16:16:59 | |阅读模式 来自 中国广东惠州
    对于dedecms这个建站程序,我想大多数站长都曾经用过,他功能之强大,几乎能秒杀一切内容管理系统,而且所有页面都能生成静态的html文件,对于SEO优化也是相当有优势的,说道SEo优势,就不得不提到robots.txt的设置方法了
         
    用过dede建站的站长就会发现,DEDECMS自带的程序文件robots。txt的置很简,由于它的适用范围特别广,所以robots.txt的设置方法会相差很多,但是都大同小异,今天我就结合自己的网站-自学轮滑网www.zixue66.com介绍一点自己的想法,适用于生成静态文件的网站,因为我的网站是准备用来做优化的仅供参考。
        
    当蜘蛛来到你网站的时候,他会首先抓取robots,然后才知道哪些可以抓,哪些不可以抓,所以我们要先给他看到可以抓的,然后才告诉他哪些不能抓

    User-agent: *  允许所有蜘蛛来网站中抓起文件

    Allow: /a/  织梦默认html文件生成位置,建议吧所有文件都生成在这问文件夹里,当你网站结构发生变化的时候,方便吧html全部删掉,然后重新生成一变,不然以前生成的文件不会删除,然后同一个页面就会出现两次在不同的文件夹里面,这样不利于蜘蛛的抓取。

    Allow: /data/sitemap.html 织梦默认生成的网站地图 因为这个文件夹是被屏蔽了的,所以这里要单独写出来

    Allow: /data/rssmap.html  织梦默认生成的rss地图 同上

    Allow: /plus/flink.php  织梦默认生成的友情链接

    以上三个文件是必须要蜘蛛抓取的

    Disallow: /list_*_1.html$ 织梦在生成栏目文件夹得时候,会默认生成index.html,但是在这个目录下还会生成一个list_*_1.html的列表第一页的文件,所以我们要把所有的列表第一个页面禁止蜘蛛抓取,不然两个相同的页面对于收录是有很大影响的。

    Disallow: /data/ 系统缓存或其它可写入数据存放目录,也是数据备份文件的存放地,所以一般这个文件夹是没有必要给蜘蛛抓取的

    Disallow: /images/ 系统默认模板图片存放目录,完全可以静止抓取,因为对你网站一点用处都没有

    Disallow: /include/  dede程序核心文件目录,

    Disallow: /plus/  系统和安装的插件及辅助功能目录 ,没有特殊情况,建议禁止

    Disallow: /templets/  默认模板存放目录,也没必要公开

    Disallow: /uploads/ 上传下载文件保存目录,一般都是图片,如果不是做图片站的话,就禁止吧,因为蜘蛛也看不懂图片里面到底是什么

    Disallow: /index.php  默认首页文件,如果有做html静态化的话,就可以直接屏蔽掉

    Disallow: /tags.php   标签文件,也可以屏蔽掉

    Disallow: /dede 管理后台目录,需要改名,具体设置后面具体讲

    Disallow: /member 会员管理目录,有些文件可以开放,但是如果你网站没有开启会员功能,就可以直接删除这个文件夹

    Disallow: /404.html   如果你有做404页面,也是可以直接屏蔽的,因为这个页面对优化没有什么用处,

    Allow: /plus/search.php 开放禁止目录里的具体文件

  ...

     基本设置就是这样,下面着重讲下后台管理目录和栏目页的设置:

    1.dede目录,为了网站安全着想,根据自己的情况进行改名。改成一个你自己能记住的目录名字(英文)都行,但是这个目录还是需要用robots.txt屏蔽掉的,大家不免疑惑了:在robots.txt里面应该怎么设置呢?如果是直接禁止抓取,还是泄露了后台目录,改名所给网站带来的安全就无效了。那么我们就用通配符*来解决这个问题。比如我们网站后台目录改名为zixue66,那么我们就可以通过下面的方法开解决这个问题:

    Disallow: /z*6  只保留文件的第一个字母和最后一个字母就行,或者只用*代替一部分字母都是可以的

    这样设置我们即禁止了搜索引擎的抓取,又不会泄露了后台目录名称。保证了网站的安全

    2.栏目页。有些站长会发现,如果网站没有做伪静态优化的话,栏目分页后会有两个链接指向栏目首页,如*/web/和*/web/list_1_1.html,其实*/web/是默认的index.html文件,他和目录第一页是完全一样的,为了网站的优化,建议先将栏目分页优化以下(具体做法大家可以在网上找),把首页和第一页的链接改为*/web/的形式,然后在robots.txt文件里做以下设置:
        
    Disallow: /list_*_1.html$ 这样设置就不会造成两个页面一致的情况了,
        
    我在写这篇文章之前,有看见网上有人这么设置的Disallow: /*1.html$,如果这样设置,那么在你文章页个位带1的是不是都被屏蔽掉了,比如说*/web/71.html。这点请大家注意

    以上就是织梦dedecms robots.txt文件的设置方法,大家可以根据自己的情况开进行优化设置。

    注意事项:

    1.按官方说明设置好目录权限;这个权限你可以联系你的空间商帮你完成。

    2.网站后台目录改名后的开头字母和结尾字母不要和其他目录一样,否则其他目录会被一起屏蔽掉

    3.用百度站长工具测试一下robots.txt文件设置是否有效。

转载请保留出处 成都装修公司标筑装饰:www.028cdbz.cn

详细设置方法可以我联系

107

主题

328

帖子

244

积分

落伍者(一心一意)

Rank: 1

贡献
160
鲜花
0
注册时间
2013-10-11

落伍微信绑定QQ绑定落伍者落伍手机绑定

 楼主| 发表于 2013-11-7 10:57:07 | 来自 中国四川成都
自己无意中居然搜到了自己的帖子,支持一下
头像被屏蔽

1

主题

10

帖子

-19

积分

尚未落伍(少量栏能回帖)

贡献
0
鲜花
0
注册时间
2008-10-8
发表于 2014-9-18 12:43:17 | 来自 中国广东广州
提示: 作者被禁止或删除 内容自动屏蔽

330

主题

775

帖子

799

积分

落伍者(一心一意)

Rank: 1

贡献
272
鲜花
2
注册时间
2013-5-30

落伍手机绑定

发表于 2014-11-1 02:48:07 | 来自 中国湖南长沙
还不错,我的也是这样设置的

154

主题

1370

帖子

275

积分

落伍者(一心一意)

Rank: 1

贡献
31
鲜花
0
注册时间
2012-8-29
发表于 2015-9-10 18:05:42 | 来自 中国天津
很不错啊

0

主题

281

帖子

14

积分

落伍者(一心一意)

Rank: 1

贡献
15
鲜花
0
注册时间
2015-6-17

落伍者

发表于 2015-11-24 00:16:56 | 来自 中国山西朔州
头像被屏蔽

308

主题

558

帖子

171

积分

禁言

贡献
619
鲜花
0
注册时间
2017-8-31

落伍手机绑定

发表于 2017-9-10 07:37:09 | 来自 中国山东潍坊
提示: 作者被禁止或删除 内容自动屏蔽
签名被屏蔽
论坛客服/商务合作/投诉举报:2171544 (QQ)
落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
© 2001-2014

浙公网安备 33060302000191号

浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

  落伍法律顾问: ITlaw-庄毅雄

手机版|找回帐号|不能发帖?|Archiver|落伍者

GMT+8, 2024-11-23 02:52 , Processed in 0.062962 second(s), 33 queries , Gzip On.

返回顶部