《网站分析白皮书》是百度统计产品团队针对当前国内的互联网环境,参考国内外互联网专家的经验,总结了先进的网站分析方法论,其中内容并不着眼于高大全的百科全书式说教,而是针对中国互联网特殊环境,从流程、思路到分析手段介绍基础网站分析方法论,辅以实战案例说明,力求把这些来源于实战的方法让广大网站运营分析者再应用到实际网站运营中去。该白皮书仅在百度文库上传了PDF版,为了便于传播,百度站长平台特意将WORD整理奉上。
第一部分:序言
中国互联网用户群已经成为世界最大的互联网群体。与此同时,中国互联网网站的发展也历经了几个阶段,从单纯的网络媒体到现在的多元化运营,但是当前中国网站运营水平尚有很大提升空间,在DCCI最近发布的《2011中国站长调查暨互联网生态报告》中提及:站长们最常使用的工具是流量统计分析类工具,广大互联网从业者也需要用网站分析方法来武装自己:充分运用流量分析系统了解网站和访客的现状和趋势,用数据驱动运营策略和推广的调整,更有针对性地管理网站,逐步达到既定目标。
百度统计产品团队针对当前国内的互联网环境,参考国内外互联网专家的经验,总结了先进的网站分析方法论,其中内容并不着眼于高大全的百科全书式说教,而是针对中国互联网的特殊环境,从流程、思路到分析手段介绍基础网站分析方法论,辅以实战案例说明,力求把这些来源于实战的方法让广大网站运营者再应用到实际网站运营中去。
本白皮书在前期调研过程中听取了大量站长和网站分析师的意见,但实事求是地说仍有较大提高空间,也欢迎大家多提建议。
第二部分:网站分析的概念和意义
网站分析是什么
网站分析是指在获得网站访问量等基本数据情况下,分析网站数据,从中发现访客访问网站的规律和特点,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动和运营中可能存在的问题和机遇,并为进一步修正或重新制定策略提供依据。
网站分析的意义
网站分析需要对站内站外一系列数据的对分、分析和验证来指导网站监控流量、吸引流量、保留流量,并利用流量完成转化等目标,带来的实际收益主要包括以下几点:
监控网站运营状态
网站分析最基本的应用就是监控网站的运营状态。收集网站日常产生的各类数据,包括浏览和访客数据等,并通过统计这些数据生成网站分析报表,对网站的运营状态进行系统地展现。从浏览数据的变化趋势,到比较新老用户比率等,数据帮助运营者从多角度观察网站的状况是否良好。
提升网站推广效果
常见网站推广方式主要包括SEO(SearchEngine Optimization,搜索引擎优化),SEM(Search Engine Marketing搜索引擎营销)和广告投放推广。SEO分析主要是分析网站在各搜索引擎的搜索词排名和点击,以及网站在搜索引擎的收录、排名和展现情况。SEM分析是通过了解从搜索引擎商业推广结果页导入的流量后续表现,进而调整网页在搜索结果页上排名,针对搜索引擎用户展开营销活动。另外,网站分析可以定制化地细分来源和访客,从而进行有针对性的广告推广营销。
优化网站结构和体验
通过分析网站的转化路径,定位访客流失环节,有针对地查漏补缺,后续通过热力图等工具有效地分析点击分布和细分点击属性,摸清访客的常规行为和人口学属性,提升网站吸引力和易用性。
第三部分:流量分析原理
流量统计原理主要有两种:传统的基于日志文件统计和当前较为流行的基于脚本(JavaScript等)统计。
● 基于日志文件的统计
通过分析网站后台的日志文件来统计访客的浏览和点击行为。这种方法的优点是简单方便,无需修改网页代码,可以收集网络爬虫数据等。缺点是网站日志包含所有日志数据,需预处理来提升数据质量;而且无法统计到页面缓存导致的缓存浏览数据。
● 基于脚本的统计
此方法需要在网站的html代码中嵌入一段脚本(JavaScript等)用于统计访客的浏览等行为。这种方法的优点是技术难度低,只需嵌入脚本代码,无需配置服务器;能够快速获取点击、响应等数据并方便展现;不需要担心缓存带来的影响,数据的准确度较高。缺点主要是无法统计网络爬虫的信息。当前主流的流量分析系统绝大部分采用此种方法收集数据,包括百度统计和谷歌分析等。以下为网站分析工具的JavaScript收集数据流程图:
第四部分:如何对网站分析指标
网站分析中都用到哪些衡量指标?又如何分析这些指标呢?举个例子来说明,如果把一个网站比作一家超市,运营网站就像打理超市的生意,那么目标就是让访客多停留、多购买、多办几张会员卡。为了达成这个目标,我们先要了解当前的情况,比如有多少人走进了超市、看了多少件产品、多少人办理了会员卡;类似地,在网站分析中我们也要了解这些数据,并作为后续业务调整的依据:比如,多少人进入了网站、浏览了多少页面、多少人办理会员等,网站分析指标是数据化地呈现网站运营的状况,帮助站长从各维度了解访客,优化网站。常见指标为:浏览量(PV)、访问次数、访客数(UV)、新访客数、新访客比率、IP、跳出率、平均访问时长、平均访问页数、转化次数、转化率。可以概况为3类,流量数量指标,流量质量指标,流量转化指标。
流量数量指标
1.浏览量(PV)
定义:页面浏览量即为PV(Page View),用户每打开一个页面就被记录1次。
技术说明:一个PV即电脑从网站下载一个页面的一次请求。当页面上的JS文件加载后,统计系统才会统计到这个页面的浏览行为,有如下情况需注意:1.用户多次打开同一页面,浏览量值累计。2.如果客户端已经有该缓冲的文档,甚至无论是不是真的有这个页面(比如JavaScript生成的一些脚本功能),都可能记录为一个PV。但是如果利用网站后台日志进行分析,因为缓存页面可能直接显示而不经过服务器请求,那么不会记录为一个PV。
涵义:PV越多越说明该页面被浏览的越多。PV之于网站,就像收视率之于电视,已成为评估网站表现的基本尺度。
2.访问次数
定义:访问次数即Visit,访客在网站上的会话(Session)次数,一次会话过程中可能浏览多个页面。
技术说明:如果访客连续30分钟内没有重新打开和刷新网站的网页,或者访客关闭了浏览器,则当访客下次访问您的网站时,访问次数加1。反之,访客离开后半小时内再返回,则算同一个访次,以上对访客的判断均以Cookie为准。
涵义:页面浏览量(PV)是以页面角度衡量加载次数的统计指标,而访问次数(Visit)则是访客角度衡量访问的分析指标。如果网站的用户黏性足够好,同一用户一天中多次登录网站,那么访问次数就会明显大于访客数。
3. 访客数(UV)
定义:访客数(UV)即唯一访客数,一天之内网站的独立访客数(以Cookie为依据),一天内同一访客多次访问网站只计算1个访客。
技术说明:当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发一个Cookie,记录访问服务器的信息。当下一次再访问服务器的时候,服务器就可以直接找到上一次它放进去的这个Cookie,如果一段时间内,服务器发现两个访次对应的Cookie编号一样,那么这些访次一定就是来自一个UV了。
涵义:唯一访客数(UV)是访客维度看访客到达网站的数量。
4. 新访客数
定义:一天的独立访客中,历史第一次访问网站的访客数。
涵义:新访客数可以衡量营销活动开发新用户的效果。
5. 新访客比率
定义:新访客比率=新访客数/访客数。即一天中新访客数占总访客数的比例。
涵义:整体访客数不断增加,并且其中的新访客比例较高,能表现网站运营在不断进步。就像人体的血液循环一样,有新鲜的血液不断补充进来,充满活力。
6. IP数
定义:一天之内,访问网站的不同独立IP个数加和。其中同一IP无论访问了几个页面,独立IP数均为1。
涵义:从IP数的角度衡量网站的流量。
流量质量指标
1. 跳出率
定义:只浏览了一个页面便离开了网站的访问次数占总的访问次数的百分比,即只浏览了一个页面的访问次数 / 全部的访问次数汇总。
涵义:跳出率是非常重要的访客黏性指标,它显示了访客对网站的兴趣程度:跳出率越低说明流量质量越好,访客对网站的内容越感兴趣,这些访客越可能是网站的有效用户、忠实用户。该指标也可以衡量网络营销的效果,指出有多少访客被网络营销吸引到宣传产品页或网站上之后,又流失掉了,可以说就是煮熟的鸭子飞了。比如,网站在某媒体上打广告推广,分析从这个推广来源进入的访客指标,其跳出率可以反映出选择这个媒体是否合适,广告语的撰写是否优秀,以及网站入口页的设计是否用户体验良好。
2. 平均访问时长
定义:平均每次访问在网站上的停留时长,即平均访问时长等于总访问时长与访问次数的比值。
涵义:平均访问时间越长则说明访客停留在网页上的时间越长:如果用户对网站的内容不感兴趣,则会较快关闭网页,那么平均访问时长就短;如果用户对网站的内容很感兴趣,在网站停留了很长时间,平均访问时长就长。
3. 平均访问页数
定义:平均每次访问浏览的页面数量,平均访问页数=浏览量/访问次数。
涵义:平均访问页数多说明访客对网站兴趣越大。而浏览信息多也使得访客对网站更加了解,这对网站市场信息的传递,品牌印象的生成,以至于将来的销售促进都是有好处的。一般来说,会将平均访问页数和平均访问时长这两个指标放在一起分析,进而衡量网站的用户体验情况。
流量转化指标
1. 转化次数
定义:访客到达转化目标页面,或完成网站运营者期望其完成动作的次数。
涵义:转化就是访客做了任意一项网站管理者希望访客做的事。与网站运营者期望达到的推广目的和效果有关。
2. 转化率
定义:转化率=转化次数/访问次数。
涵义:转化率即访问转化的效率,数值越高说明越多的访次完成了网站运营者希望访客进行的操作。
案例说明
如下图是一个访客进入网站的访问行为记录,可以统计到如下指标数据:
统计数据:
● 浏览量=4
● 访客数=1
● 访问次数=2
● 平均访问时长=5分钟 平均访问页数=2
● 跳出率=50%
● 如果C是设置的转化目标页面,则转化次数为1,转化率=50%
第五部分:网站分析流程
网站分析流程其实就是一个发现问题、分析问题和解决问题的过程。利用规范的分析流程会避免逻辑混乱,更加清晰和有效地优化网站。以下是总结出来的网站分析流程供大家参考:
明确目标 制定计划
哲学上有三个问题:“我是谁?我从何处来?我要到哪里?”网站分析第一步也有三个问题需要好好思考:“网站的现状如何?网站的是如何发展起来的?网站的发展目标是什么?”首先,对网站现状必须有客观的认识,有多少资源,达到了什么规模,访客积累的程度如何等。其次,对网站的发展历程总结,能更有针对性地规避风险,寻找机会。最后,也是最重要的,是要明晰网站未来发展的目标,一般来说网站的远景目标有以下几点:
1. 赚钱:直接增加网站的盈利能力,如京东等电子商务网站
2. 品牌:增加网站作为媒体的品牌影响力,如新浪网等网络媒体
3. 合作:服务网民或者给其他网站导入流量,如一些小说导航网站等。
上述远景目标为发展方向,还要将其明确成具体目标,比如电子商务网站需要关注提升销售额和/或降低成本,网络媒体关注提升用户黏性和/或吸引更多的访客来访。在实际操作层面还需要进一步把具体目标落实到指标层面,这样才可以量化评估,推进到实际操作中去。比如电子商务网站进一步关注的指标是“平均每个订单的销售额”和“广告投放成本”,网络媒体进一步关注的指标是“PV”、“UV”等。结合网站内外部情况,预计网站未来的发展,细分维度,制定合理的KPI(Key Performance Indicator),即上述关注指标到怎么的数值才算达到目标,所以KPI就像标杆一样丈量网站进步的情况,是否达到预定目标参照到达KPI的标准,让网站运营的方向更加明晰,让网站更高效地达到目标。
选择系统 部署网站
这个环节是网站数据分析实践的开始,是收集和获取数据的过程,需要选择合适的网站分析系统来满足分析计划的需求,仅从满足网站分析基础需求角度举出以下几点供大家参考:
● 部署简单
尽量选择部署方便的网站分析系统,特别是中小网站技术人员不多的情况下,最好选用通用代码安装,即全站安装代码一样,无须针对转化跟踪等功能调整代码,也有益于提升后续实施复杂网站分析的可扩展性。
● 数据全面
虽然网站分析者最关注的就是根据网站目标推理出的KPI指标,但全面的指标更能帮助站长了解网站的情况,而且要关注该系统中指标是如何定义的,是不是自己想要的;另外,类似访问次数(Visit)这样重要的基础指标是不是全部报告中都具备,不要后续因为某个或某几个指标的缺失而更换流量分析系统。
● 功能完备
网站分析的对象主要包括流量来源、网站访客和网站内容,针对这些对象,流量分析系统需要有相应的报告,方便快捷地提供数据。另外,高实时性非常有必要,即能实时地了解到几分钟甚至几秒钟之前流量和具体到访客的变化,尤其是考虑中国互联网环境的复杂特点,需要快速地掌握流量的突增和突降,迅速地找到问题并修正。最后,网站分析需要精确地了解访客每个点击行为从而更高效地分析访客的意图,热力图(Heat Map)和链接点击图(In-Page Analytics)这样的图形化分析报告解决该类问题的利器。
● 运行稳定
因为收集整理网站的历史数据对今后的数据分析极其重要,在选择时要慎重。所以建议选择大型的流量分析系统提供商,他们会稳定长期地提供网站数据统计分析服务;另外,建议选择服务器规模大而且地址在国内的服务商,否则在收集和传输过程中数据丢包会导致统计数据质量大大降低,参考价值有限。
如上部署即是做好收集数据的预处理工作,获得完整、真实、准确的数据是后续分析工作的前提。另外,对于一些和网站业务紧密相关的分析工作需要提前在系统中进行设置,比如转化目标跟踪等,就需要明确访客到达哪一个或者哪一些页面是转化成功。最后,任何流量分析系统都只是一种工具,还需要网站分析方法论的理论指导,正确地应用到实际工作中去。
测量指标 分析现象
搭建系统成功就能获得完整、真实、准确的数据,接下来就是对统计数据进行分析,与流程第一步设定的KPI目标进行比较,找到问题。通常说的分析本质上是透过现象看本质,在网站分析中则是从字面上的数据中找到网站本质上的问题。所以,在分析过程中要注意思路和方法,思路包括细分和趋势分析等,方法则更需有针对性,包括SEO分析等,这些方法论详见后叙。另外,如果爱都不是几滴眼泪几封情书,那么分析结果也不是几张数据表几个趋势图——对数据的简单统计描述还远远不够,最后一定要归纳和总结问题。
改进业务 跟踪问题
分析指标,发现问题之后,下一步解决方案也要梳理清楚:问题有没有解决方案,有哪几种,每个方案的优缺点都是什么,如何落实。此处是网站分析最关键的环节,一定要把分析落实。所有的解决方案可能未必都能立即实现,可以是性价比不合适,可以是没必要,可以是风险太大,可以是收益不明确,不过一定至少要把原因搞清楚,等到时机成熟在启动整改。另外,还要注意监控改进的结果:网站出问题了就像人生病了,现成的改进方案很可能只是在做手术,更重要的是手术后病情观察和会诊,甚至继续再做几次手术。比如网站的流量一直持续下跌,可以选择马上买来流量或者搞推广活动吸引流量进来,不过这些大多只能短期提升,后续还需要不断提升网站本身的内容质量和用户体验来长期保持访客群体的数量和质量。
第六部分:网站分析思路
网站分析思路综述
很多人开始进行网站分析时候都感觉没有思路,不知道从那种角度看数据。以下将会先简述总体分析思路,再较为详尽地和大家介绍下最为常用的趋势和细分分析思路。总体的网站分析思路可以总结为简单八个字:“微观监控、宏观调控”:
微观监控:
指对一些关键的实时更新数据监控要细致、全面,不能遗漏重要点,防微杜渐,比如刚刚购买了某个推广渠道的流量,要特别关注这个渠道流量的变化,防止流量作弊;类似地,这种计划外的流量变化监控要全面和及时,把运营风险降到最低。
宏观调控:
指观测网站的整体流量,结合内外部数据(本网站历史数据和竞争对手情况)进行分析,从而制定出较为长期的改进方向,并在后续的操作中结合实际情况具体实施。
举个例子,中央政府发现国家投资过旺,而消费不足(整体掌控),长久下去不利于GDP的健康增长,于是提出“扩大内需”的指导思想(结合数据分析);虽然“扩大内需”不具有直接的操作性,也不是马上就能操作的(长远调整),但是地方政府领会之后会结合自身的特点,提出并执行适合当地情况的具体可行方案(结合实际情况具体落实):比如四川发熊猫卡,让大家去旅游;比如山东把家电超市搬到农村去卖等等;而中央政府也会把好的经验进行总结,有推广价值的会全国推广,如此良性循环。换位网站分析的工作,我们可以先了解整个网站流量的变化,再细分分析多个子频道的流量变化情况,由于每个子频道的特点不尽相同,可以在综合分析数据增长或者下降后,有针对性地提出推广活动吸引流量或者美化页面视觉效果等的整改方案,并在后续的操作中不断调整。
因此,在所管理的网站数据范围内(整个网站或某个子频道),网站分析者就像公司的老板,网站分析系统就像是公司里的业务员,许许多多业务员将信息采集上来,做出一定的加工并呈现给老板,老板要做的就只有“微观监控、宏观调控”。
细分分析——从表象到本质
一,为什么要细分分析
网站分析的对象主要包括:流量来源、网站内容、网站访客。
流量来源:流量是网站的重要资源,流量来源可以分为:直接访问、搜索引擎、外部链接这基本的三个类,其中每个类别还可以继续细分,如搜索引擎可以细分为百度、谷歌等。针对上述某类或者某个来源做细分分析,找到原因并改进或优化。
网站内容:
一般来说,网站可以分为几个子频道,每个子频道又可以由许许多多页面构成的,网站的子频道和具体页面承载的内容和针对的访客都有所不同,站长分析网站流量就要更有针对性地选择页面进行分析。
网站访客:
网站访客的指标数据(UV、IP)背后都是活生生的互联网使用者,他们有着不同的分析属性(新/老访客、地域)和人口学属性(性别、年龄、学历等);带着不同的目的,从不同的来源进入,访问轨迹也不同,在分析中要细分符合市场定位的访客,做定向的对比研究。如下图即是访问过网站的每个访客的基本情况,包括地域、来源、上站时间和访问页数等。
以上这些都是网站分析要研究的,在数据中能发现问题和机遇的线索,而细分分析则可以帮助网站管理者有效地定位具体问题,确定了具体的方向才能有的放矢地解决问题。这个过程常常就像剥洋葱皮一样,一点点接近问题的本质,虽然可能要痛苦地流泪,但结果往往是很有价值的。
二,如何做细分分析
在了解网站运营状况的前提下,对上述的来源、访客、内容等进行细分,可以逐步地定位问题或者找到机会。例如,有一家小网站想要在北京地区做推广工作,笔者对其按照以下步骤进行细分,这样更好地了解该地区访客的访问习惯,让工作更有针对性。如图所示,在百度统计的【受访页面】报告中对网页的访问情况进行筛选:
1. 筛选地域,过滤出【省市自治区】(还可以过滤出全国、国外等)
2. 筛选省市自治区,过滤出【北京】(还可以过滤出上海、广东等)
3. 筛选来源,过滤出【搜索引擎】(还可以过滤出直接访问、外部链接等)
4. 筛选搜索引擎,过滤出【百度】(还可以过滤出谷歌、搜狗等)
当在过滤栏里精挑细选要关注的交叉维度后,系统在下方的【受访页面数据表】里就会提供页面URL的各个指标,精确地把数据呈现出来方便分析。比如下图所示,其中第一个链接是网站首页,我们就可以了解到北京的访客通过搜索引擎中的百度到达网站上的后续表现,用指标说明即:PV为50,平均停留时长为00:01:59,退出率为38%。
4.用户群细分:
对于自身定义的用户群等属性的细分,我们推荐使用百度统计的js api,利用百度统计的自定义变量(_setCustomVar)可以做访客、访次和页面级别的自定义用户属性。语法:_hmt.push([\’_setCustomVar\’, index, name, value, opt_scope]); 如:_hmt.push([\’_setCustomVar\’, 1, \’login\’, \’1\’, 2]);其中opt_scope 可选自定义变量的作用范围分为三种:1为访客级别(对该访客始终有效)、2为访次级别(在当前访次内生效)、3为页面级别(仅在当前页面生效),默认为3。
上述的每一个级别都对应了一个作用范围,每一个自定义变量都是限制在某个范围内的。
在需要对不同类别的访客今后的一系列行为做区分筛选的时候建议使用访客级别,比如“否是VIP会员”等标签;在需要对本访次的用户行为或状态做区分筛选的时候建议使用访次级别,比如“是否登陆”等标签;在需要对本访次的访问内容或访问路径做区分筛选的建议使用页面级别,比如看了“体育频道”还是“财经频道”等标签
趋势分析——有比较才有进步
一,为什么要趋势分析
如上文中谈到的,网站的进步体现在指标提升,网站的问题体现在指标下降。流量分析系统常常将这些数据在时间维度上展现成趋势。我们需要为关注的指标设定参考值,通过这些参照和比较来了解网站的目前运营情况以及同预期目标的距离。
二,如何做趋势分析
当前所谓的趋势分析,即是基于时间序列的数据趋势分析,主要以同比、环比、定基比为具体的分析手段。为了能让大家更好地理解后续的分析思路,现名词解释如下:
● 时间序列:指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。在流量分析系统中通常可以选择一段时间呈现指标数据的连续变化情况。
● 同比:为了消除数据周期性波动(季节等)的影响,将本周期内的数据与之前周期中相同时间点的数据进行比较。例如今年第n月与去年第n月比。
● 环比:指的是将本期的数据与前期的数据进行比较,反应的是数据连续变化的趋势可以是日环比、月环比、周环比等,例如今年第n月与第n-1月或第n+1月比。
● 定基比:将所有的数据都与某个基准线的数据进行对比。通常这个基准线是公司或者产品发展里程碑,将之后的一段时期内的数据与这个基准线进行比较,从而反映公司在里程碑后这段时期的发展状况。
以下举例说明,在百度统计中登录后的概况页面就有便捷地同比和环比对比:
环比:上方数据表显示的今天与昨天的各个指标数据对比
同比:下方的折线图显示的是今天每小时数据与上周的同一天的各个指标对比
另外,在【趋势报告】等带有时间控件的报告中可以选择任意两天的数据比较,依据网站实际业务指定基准线,划定时间范围,选择观察指标的变化情况。
最后,基于时间序列的趋势分析方法还有很多,其中同比和环比是最简单易用的,网站分析中大多数的常见数据分析均可以用如上思路快速观察关键指标的变化情况,了解现状,衡量达成目标的进度。