百度自动推送代码进一步优化
温馨提示:本文最后更新于2019年3月8日 07:47,若内容或图片失效,请在下方留言或联系博主。
每个站长都知道。做网站想要加快收录的速度,必须要在想被收录的页面添加百度的自动推送代码,此代码让用户每次浏览该页面的时候都会向百度提交一次。省去了站长的人工操作,极大的提升了收录效率。但是这代码中每一行的含义却少有人知道,仅知道此代码可以自动推送,却不知道是如何实现的,假如知道每一行的含义,则可以根据需要进行自行设置,以降低代码的冗余,提升运行效率。代码如下:
<script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script>我们来仔细看看这个JS代码,它首先是用if函数判断了当前浏览的网址协议是经过SSL加密过的https或者是其他类型的网址,根据不同的类型分别访问了2个JS文件。之后会将访问的JS文件内容生成脚本插入到当前的url页面中,运行该脚本则会读取对应的一个非常小体积的gif图像,在这个过程中将url地址推送到百度中。
分析了以上代码我们会发现,它在判断的时候会加载2个百度的js资源,这个可以根据用户自己的url地址类型去掉不必要的判断,并且可以将其直接替换为gif地址。另外一点就是当访问的url地址为动态地址,带有非常多的参数的话,是很不利于搜索引擎爬虫的抓取的。我们在之前使用MIP的时候接触了一个非常有用的标签,那就是canonical标签,可以使用该标签对这一点进行优化。
优化后的代码如下:
<script> (function(){ var canonicalURL, curProtocol; //Get the <link> tag var x=document.getElementsByTagName("link"); //Find the last canonical URL if(x.length > 0){ for (i=0;i<x.length;i++){ if(x[i].rel.toLowerCase() == 'canonical' && x[i].href){ canonicalURL=x[i].href; } } } //Get protocol if (!canonicalURL){ curProtocol = window.location.protocol.split(':')[0]; } else{ curProtocol = canonicalURL.split(':')[0]; } //Get current URL if the canonical URL does not exist if (!canonicalURL) canonicalURL = window.location.href; //Assign script content. Replace current URL with the canonical URL !function(){var e=/([http|https]:\/\/[a-zA-Z0-9\_\.]+\.baidu\.com)/gi,r=canonicalURL,t=document.referrer;if(!e.test(r)){var n=(String(curProtocol).toLowerCase() === 'https')?"https://sp0.baidu.com/9_Q4simg2RQJ8t7jm9iCKT-xh_/s.gif":"//api.share.baidu.com/s.gif";t?(n+="?r="+encodeURIComponent(document.referrer),r&&(n+="&l="+r)):r&&(n+="?l="+r);var i=new Image;i.src=n}}(window);})(); </script>从这个优化过后的代码中引入了canonical标签,无论用户访问的url地址带有什么样的参数,均会返回canonical标签唯一对应的url地址,大大减少搜索引擎爬虫的负担,并减少搜索引擎爬虫对同一页面的抓爬次数,这对于具有大量动态url的网站来说是非常大的提升。另外从优化后的代码中也可以看到,使用了一个三元运算来对url的协议类型进行判定,判定后的结果会直接访问百度对应的gif地址,从而去除了之前代码访问JS脚本的操作,也在一定程度上对页面的性能进行了优化,提升了页面运行的效率。
在使用优化后的代码需要注意的是
1、将r=localcanonicalURL的值修改为用户自己的canonical标签所对应的url的值;
2、时常访问gif地址,确保地址正确可以访问,否则代码会失效,需进行手动更新。