灰色词SEO快照劫持与推广揭密
时间:2023-04-24 18:42:01 | 来源:网站运营
时间:2023-04-24 18:42:01 来源:网站运营
灰色词SEO快照劫持与推广揭密:SEO大神brooks的文章值得深读,研究SEO应有的态度,不是无脑的相互模仿,而已追根逆源,找出背后的原理。好了开始正文分享(如有侵权联系删之)
一,什么是灰产黑帽SEO?
关于灰色词SEO大家可能见过,放不多说先上个图:
相信大家对于上图都比较熟悉,基本上也都见到过。但是很多人都好奇这玩意是怎么做到的?
有没有很高深的技术呢?
正好今天在浏览简书的时候有看到,索性就花了半小时研究了一下,发现其实原理都很简单,用到的都是seo的基础知识哈。
上面截图出来的一共有三种不同的操作手法,这里会一一讲解到。
二,灰产SEO玩法:借鸡生蛋 套路首先看排名第一的,直接点进去看看。发现这个就是简单的构造搜索链接来达到收录推广的目的。
但是这玩意,不能说你构造出来就行了,还得让百度蜘蛛发现和收录吧?咋办呢?发外链呗,到各大平台去留言,通过留言来发外链就好了。就比如下图的,就是在简书上留言:
奥力给有木有,虽然简书对这些留言链接进行了nofollow,但是不影响百度的链接发现的。由此也可以得出一个结论,nofollow对于百度的抓取似乎并没有什么太大的影响?那么nofollow影响的是啥?
这个标签的意义是告诉搜索引擎,这个链接不是经过作者自己编辑的,所以这个链接不是一个信任票。搜索引擎看到这个标签就可能减少或完全取消链接的投票权重。
所以,大家在给网站加nofollow的时候,可要考虑清楚你要加它的目的是干什么?不能瞎搞哈。
排名第二的就有点意思了,我们来看看:
我们发现,点击进去页面是正常的。首先有了先例之后,我就开始怀疑会不会是在链接上做了手脚呢?比如有两套不同的链接,但是可以访问同样的页面。有了想法,就开始去验证,回到首页点击其它的新闻看看正常给到的新闻页面是什么样的。
发现了么,URL的结构不一样,当然,这个是最新的。而之前那个是2016年的,而且没有HTTPS。那就是说可能URL经过改版了。而且原来的那套URL也还能访问。于是动手改了一下,发现真的可以。
不过这个并不能验证为啥title被改掉了,因为目前这个手法还是比较流行的。其它的大站也都有“中招”。看起来像是快照劫持,但是快照劫持要入侵服务器,修改文件响应,按道理来说,搜狐、新浪这些大站点应该不至于那么容易被hack,而且量又不大。看看下图的:
都是比较出名的大站,而且都是标题改了而已。目前,初步怀疑是外链锚文本+301跳转导致的,具体不是很清楚,有知道的大兄弟可以私我说说哈。
三,黑帽灰产SEO之伪造关键词
来看看第三种方式,伪造关键词tag页面。
都是网易的标签页,打开看看:
404来的,看到一长串的数字。老头疼的,本着学习的目的,继续深究一下看看能不能找出点啥东西出来。先去瞅瞅正常的tag页面是啥样的,随便找个子栏目的列表页看看:
这些就是关键词,鼠标移上去就会在左下角看到他们的链接。这里整理贴出来给大家看看:
# 刘涛 http://ent.163.com/keywords/5/1/52186d9b/1.html# 鬓边不是海棠红 http://ent.163.com/keywords/9/1/9b138fb94e0d662f6d7768e07ea2/1.html# 清平乐 https://ent.163.com/keywords/6/0/6e055e734e50/1.html# 塞上风云记 https://ent.163.com/keywords/5/5/585e4e0a98ce4e918bb0/1.html
可以看到,链接的pattern是这样的:
https://ent.163.com/keywords/{加密ID[1]}/{加密ID[3]}/{加密ID}/1.html
可以总结出网易的tag链接组成特征:
1. keywords后面跟着的两个数字目录就是关键词加密后的,第一和第三个字符2. 关键词加密后的长度跟关键词的字数成正比
接下来就是要研究它的加密算法了,一般的,看加密算法先了解字符串的长度和特征,这里就不说了。看到加密后的都是小写的数字加字母,而且字母只出现了a/b/c/d/e/f这几个,再结合加密后的长度验证,得出这个就是一个简单的16进制加密:
可以看到,这个一个汉字对应得出4个数字的加密,那这个就是16进制的加密了,16进制是占用4个字节的,所以刚刚好。但是这些汉字是如何转换成数字的呢?如果对编码熟悉的童鞋就会知道,一个汉字得到4个数字,不就是unicode编码的16进制表达么。只要轻松转换一下就好了。这里补充一下,由于字母转换成unicode编码的16进制之后,得到的是两位数,因此需要对它进行等宽对齐到4位。
有了想法,那么就是校验的过程了,代码搞起来:
校验成功之后就是封装成函数了,好方便调用:
就是这么简单,然后就是批量生成关键词的链接,拿去发外链就好了:
特么牛掰,不得不说,做黑帽的技术就是牛,不佩服不行。
今天的分享就到这里,如果你能看懂相信一定是懂程序开发的大神级人物了,如果看不懂也不需要深入研究,了解下黑帽SEO的玩法原理也无妨。
那么问题来了,为啥这些构造出来的404页面也能够被收录呢?欢迎大家留言探讨。