最近,在站长圈刮起一股劲风,可能你已经知道是什么了,没错,就是百度即将上线的劲风算法。其实,劲风算法跟小网站没啥网站,因为小网站,在正常情况下,页面都不会超过10000个,而,劲风算法主要打击的是不利用户体验的聚合页。
什么是聚合页?
从字面意思理解,把信息聚集到一个页面中,正确的说,是把同一注意的内容聚集到一个页面当中来。
如果能在这种状态下,对用户体验绝对是好的,方便用户一站式解决问题。
但,我们反过来思考一下,当你通过搜索引擎,搜索有关“减肥方法”的信息,看到一个聚合页面点击进去,本以为会有自己想要的信息,解决该聚合页全都充斥了游戏、育儿等不相关的信息,减肥的信息只有1-2条,是不是瞬间有种被骗的感觉。
这类的聚合页,就是百度搜索引擎所说的,为了优化而优化的页面。
不过,从另外一方面来说,凡是搜索引擎打击的,说明该方法都是确实有效的,只不过我们要换换思路来做而已。
总核心原则:
帮助用户解决问题为主。
一、劲风算法惩罚的目的
劲风算法,主要惩罚的对象是针对恶劣的聚合页。
不管是网站还是百度智能小程序,都在劲风的惩罚范围内。而基于这个算法的面世,其主要问题是行业内,存在很多单纯以获得流量为目的,不管用户搜索需求满足度以及搜索体验的聚合页。百度为了保障搜索用户在使用搜索引擎时的整体体验,同时保证搜索排序的公平公正性。上线了劲风算法。就是为了惩罚创造这一类聚合的网站。
二、而针对恶劣聚合页,主要分为四种类型:
1、站点内容跨领域或过于分散
这个指的是网站中包含了太多领域的词汇。例如你既要做游戏、又搞教育,还参与了加盟,甚至有电影。不仅搜索引擎无法识别你网站自身的专注领域,用户访问你站点的聚合页后,得到的体验也是极差的。
这种网站一般都是通过采集拼凑的内容。而这种网站也基本可以理解为是完全基于流量目的的流量站。只能是站长单方面获得了流量,但对用户、对搜索引擎都是伤害的。
2、标题与内容不相符
这里所说的标题,更多的可以理解为是我们聚合页面的关键词,例如这个聚合页你的关键词是SEO培训,而里面调取的内容有介绍游戏的、介绍电影的等与关键词本身不相关的内容。这样即便搜索用户进入到你这个聚合页,还是不能很好的解决用户需求!
3、利用站内搜索生成的聚合页
利用站内搜索功能,批量生成静态页面,这种操作是批量生成聚合页的惯用手法。多为大内容量较大的网站盛行。
SEO通过大量的关键词整理,然后技术人员以这些词为站内的搜索词,将返回的搜索结果批量生成另一种模板的页面。称之为利用站内搜索做聚合页最典型的方式。
这种页面生成的技术含量最难点在于自身搜索引擎的技术能力。而很多网站又没有专业的搜索引擎团队,即便生成出来的内容,相关性差、页面可读性低。同样是劲风算法打击的对象。
4、内容为空,或较少,以及失效的聚合页
批量生成的聚合页,以SEO为首,单纯以获取流量为目的的页面。大多都会存在聚合页内,调取的内容过少,甚至为空的现象。
这种类型的页面可想而知,毫无用户体验可言。所以劲风算法对其进行惩罚也是早晚的事情!
三、劲风算法惩罚的周期是多久?
针对命中劲风算法之后,并不是说这个网站就从此废掉了。只要改过自新、百度还是会给机会让网站重新获得百度的信任的。
而劲风算法的惩罚周期官方并没有具体公布,但通过以往算法惩罚后的经验推断。一般在3~6个月左右。具体的要视情况而定!
四、什么情况决定了劲风算法的惩罚周期呢?
从经验上来看,网站构成劲风算法的惩罚条件后。会从以下两个维度进行考虑(个人推断):
1、对搜索生态造成影响的程度,例如你聚合页的体量很大,且造成了一定时间内大量搜索用户体验较差的情况。
2、聚合页满足惩罚条件过多的,上面提到的4种情况中,满足一条就会遭受惩罚,但很有可能同时符合4种降权条件:既是领域分散的网站,又利用站内搜索批量生成静态页,且内容为空的、过少的多的自己都没统计过。
更多的会围绕这两个维度的情况,进行智能给出惩罚周期!
五、命中劲风算法后,如何进行整改,恢复?
那,命中劲风算法之后,我们就等着恢复吗?如果不对网站进行整改是基本不可能恢复的。所以恢复的前提是你已经改过自新了!而针对整改我给出如下建议:
六、从大原则上,来看劲风算法惩罚的问题
前提要明确,聚合页还是可以做的,只不过针对不能满足搜索用户需求,单纯以获取自然搜索来源流量为目的的,是不能再做了。你也不要报着上有对策、下有政策的心态,想办法去规避被惩罚。即便这一次你没有命中,那么按照百度的惯例,还会有下一次的劲风算法2.0等着你。
7、具体的一些整改措施
1、针对网站领域过于分散的:
建议确定好一个主要的领域,且将其他领域的内容robots掉,屏蔽搜索引擎抓取,且不再参与搜索引擎排名;
更完美的方式是对其他领域的内容进行删除,并将删除的内容URL在百度搜索资源平台提交404,确保网站无恙。
2、针对题文不相符的:
如果你有精力与资源,可以对应每一个聚合页的主题进行审查,确保聚合页下内容都是针对当前聚合页主题所延展的相关内容。
从技术角度看,建议通过内容相似度计算的方式将网页内的主体文本进行提取计算。得出当前聚合页的主题与内容的相似度得分。
并通过实际观察,确保相似度得分在哪个值上,是可以解决搜索用户需求的。
例如通过观察,我认为相似度得分达到62%(便于理解的假设值)的,基本都是相关页面,那么针对低于62%的暂时就别在前端页面进行展示了,如果这类URL被访问到建议设置404,并提交百度搜索资源平台!
3、针对利用搜索批量生成的:
利用站内搜索批量生成的内容,其最关键的问题在于其内容无法满足用户需求。毕竟你的搜索引擎技术无法与百度相比。这里给出的建议是:
(1)招聘精通搜索引擎的技术人员,针对搜索调取的内容相关进行大幅度提升。从而提升用户的体验度。
(2)利用第3点提到的相似度判断方式,让编辑协助完成低于62%的聚合页的内容撰写工作。以此不断提升满足62%的内容量。
(3)技术能力达不到的,可以通过其他办法进行尝试,但最终还是无法确保满足用户需求的,建议删除或者robots操作。
4、针对内容为空或过于少,甚至无效的:
内容为空,甚至过少。在你站点内容资源很丰富没得到更多调取到聚合页的情况时,可以采取以下方式:
将更多品类的内容进行搜索整理,从而提升聚合页下内容整体的丰富度,前期要保证相关性。例如我这个聚合页是围绕爬虫抓取策略展开的,那么其调取的内容都应该基于爬虫抓取的策略,不能剑走偏锋,适得其反!
其次,也可以给予你的聚合页关键词进行分类。例如爬虫抓取、爬虫算法、搜索引擎爬虫、baiduspider,我们认为是一类聚合页。当内容为空或少于X条时,我们可以通过扩展调取的维度进行补全。
从技术需求的实现角度可以为:如果当前聚合页下调取内容为0或不足X条时,那么调取当前聚合页所属关键词同类别的其他内容,补全X条。
这样一来,通过扩大调取的品类,以及给关键词做分类形成补全规则问题就能很少的得到解决!
但如果你的内容资源信息很少,那么建议设定的逻辑为:当内容低于X条,甚至为空时,当前页面返回404。另外,由于我们这些做了404的页面已经被收录或者爬虫抓取了,建议再提交百度搜索资源平台的死链提交工具,进行完备。确保不会让搜索引擎认为你网站存在大量的死链接!
下面,介绍一下应对劲风算法的一点小解决方法。1、站点内容领域分散
问题:
同一个网站存在太多跨领域的主题,比如一个网站中同时存在着,体育、游戏、视频、旅游等领域的内容。
记住,你做的不是门户,你做门户也不行。
目前,搜索引擎的倾向是垂直!
所以,网站本身跨领域的内容太多,也会成为一种累赘,耗资源不说,搜索引擎也无法给你一个准确的定位。
如何解决这个问题呢?
分两种情况:
1、新站
如果你的网站刚上线,那感觉再思考一下网站所做的重点领域,把不相关的内容给处理掉。
正常情况下,新站收录还没有起来,可以把一些没有被蜘蛛爬取过,没有收录的页面给删除掉。
注意,是没有被蜘蛛爬取,没有收录的页面
2、老站
老网站,已经有不少收录了,这个时候,你不能轻易的删除页面,很容易被搜索引擎惩罚。
可以用robots的方法,把不相关领域的页面给屏蔽掉,这是应对没有被收录的页面。如果在自查后确实不需要这些内容了,可考虑把其删除(按照新站的方法做)
如果是已经被收录的页面,也是可以用robots屏蔽,或者用301跳转到其他页面去。
注意,已经被收录的页面要删除的话,事先一定要记录好网址,后面一一提交到搜索引擎哪里去,这点很重要,切记不要把没有收录的页面地址也提交过去。
2、页面内容与标题不符
问题:
关于这个页面,说白了还是网站本身的数据不够充足,没有办法聚合出更相关的内容。
上图所示,所展现的内容只是简单的匹配了造句、句这样的字,并没有跟似有关的内容出现,文不对题的情形很严重。
解决方法:
1、建立你的聚合页词库2、针对关键词去搞内容3、利用python给关键词分词3、关键词每个词语都要调用到。
简单解释一下,比如“减肥食谱一周瘦10斤”这个关键词,通过分词之后,会变成这样:
减肥食谱一周瘦10斤
注意,上方都是跟减肥有关的,那么你在调用内容的时候,要围绕这些词语去调用内容。
比如,10斤这样的词,在通过精准调用后,可能会调用出类似这样的内容:
我的减肥方法好,瘦了10斤向着减10斤的目标去减肥
是不是都跟减肥有关呢?
前提是你的网站里面有这些内容存在,不然也是无内容可掉。
3、静态搜索结果页
这类玩法太高级,像我这种技术小白还是玩不了的,简单的说,就是通过网站的搜索引擎,把关键词导入进去,生成符合跟关键词有关的页面。
这类玩法太高级,不多少,不过总的原则是,网站内容不够多,调取数据精度不够高也是没用的。
4、空短、无有效信息、失效的聚合页
问题:
一个页面中只有关键词的多次出现,但没有跟关键词有关的内容出现,这就是无效的空页面,就像上图一样,没啥内容。
怎么解决这类问题呢?
还是以“减肥食谱一周瘦10斤”关键词来说明。
比如,你的网站并没有跟减肥食谱一周瘦10斤匹配的内容出现,那么,你完全可以调用出跟减肥食谱相关的信息出来。
只要是减肥食谱,都具有减肥的效能。
假如,我一开始只想找1种减肥食谱,但打开你的聚合面之后,给了我10种不同的减肥食谱,我也会很高兴的认为,你的内容不错。
按照这个思路,有序的组建内容。