PCYO 评测夜鸥 六度计算世界

少年强 则 中国强

离线浏览器抓取网站保存网页格式为asp.htm本地调试,access denied解决办法

      我们经常会有些文档想要从技术网站上弄下来会使用离线工具抓取某个网站的分类

      但是似乎抓取下来之后的后缀名为asp.htm


     而我们放在本地为了方便通常搭建有apache的服务器,放进去才发现,网页访问时

     总是提示:you don't have permission to access the requested object

                      还有可恶的403错误


     参考Apache官方文档:传送门


     应该是Mime文件类型无法识别导致,Apache把asp.htm作为联合的多个后缀一起来

     解析,而一般apache不会搭配asp的解析


     我们希望apache把asp.htm识别为.htm,忽略掉.asp后缀


     方法一(失败的):

         我在mime.types里面 有一行 text/html  htm html  aspasp.htm

         添加上了

         重启apache,网页依旧是403


    方法二(成功!)

         在httpd.conf里面最后添加上

               <FilesMatch asp.htm$>

                   SetHandler text/html

                </FilesMatch>

         重启apache,网页显示成功!从这里得到启示:依旧是官方文档,传送门

         依据就是,当只需要识别其中一个后缀名,而不是多个后缀名扩展名的时候,单独指认即可!==============文章系原创,拒绝山寨,转载请注明出处:传送门==================

本原创文章未经允许不得转载 | 当前页面:PCYO 评测夜鸥 六度计算世界 » 离线浏览器抓取网站保存网页格式为asp.htm本地调试,access denied解决办法

评论