管理信息化信息化知识网站统计
及其测量
第二章
网站统计和测量
传统广告中相应的测量用语
即使是在网络的发源地美国,网络媒介目前的测量也是比较混乱的,这包括测量术语、方法、
标准等原因。为了使网络测量能够走向规范,也为了我们的媒介购买人员在进行整合广告活
动(INTEGRATEDCAMPAIGN)时,在传统广告和网络广告之间做出比较,我们在本章的开头先
对传统广告测量中的术语和方法进行简要介绍:
总印象数/印象数(GROSSIMPRESSIONS/IMPRESSIONS:)
总共的媒介曝光率(总人数或者家庭),不管是否重叠。
到达率(REACH)
在特定时间内暴露于某一个广告至少一次的总人数或者家庭(非重叠的)。
有效到达率(EFFECTIVEREACH)
在有效接触频次(EFFECTIVEFREQUENCY)内暴露于某一个广告的总人数。
有效接触频次(EFFECTIVEFREQUENCY)
广告“有效”所需要的曝光次数。在大众媒介中,有效接触频次规定在广告有效之前必须达
到一定的曝光次数,它和有效曝光也是可以互换的。研究发现曝光低于 3此时将不能引起足
够的回忆,但是在购买周期较短时太多的曝光也是没有效果的。
CPM(千人成本)
每千次印象数(曝光)成本。媒介传递给 1000个人(家庭)的成本。
重叠(DUPLICATION)
在两种或者以上的媒介载具中看见广告或者活动的人的比率。
毛平点(GROSSRATINGPOINTS)
GRPS是在一周或者一月的基础上计算媒介排期效果的测量形式。大众媒介计算 GRP是已到达
率乘以接触频次。计算某一个排期的 GRP是把单个节目的收视率相加(假定一个节目中一个
广告)。也可以以总媒介的广告预算除以每收视点成本(CPRP)。
占有率(SHARE)
“观众占有率”是某一个节目或者电视台(电台)开机率(HUT、PUT、PUR、PVT)的比率。
“市场占有率”是在某一个类别中的特定品牌所产生的广告印象数的比率,但它通常指的是
媒介花费的份额。
收视率(RATING)
在特定的时刻消费(CONSUMING)某个媒介的人口比率。通常用在广播媒介中,但也可以同
在任何媒介中。
家庭开机率、个人开机率(HUT、PUT、HUR、PUR)
在特定时间打开电视或者收音机的人口(家庭)比率。
组合(COMPOSITION)
某个媒介或者载具受众的特征组合。它也指某个媒介的受众占总目标受众的比率。
每次询问成本(COSTPERINQUIRY)
在直效行销广告中获得询问的成本。计算方法是以总的直效行销广告的成本除以获得的询问
次数。
网站流量测量术语
网站流量的测量包括了用户类型、技术类型等方面的内容,譬如:
唯一访问者(UniqueVisitors)、页面浏览数(PageViews)、浏览器(Browsers)、操作系统
(OS)、分辨率(Resolution)、颜色数(Color)、插件(Plug-ins)、位置(Location)、引
进者(Referrers)、搜寻关键字(SearchWords)、时间(TimeofDay)、最近 25 个重复访问
者(Last25ReturnVisits)、高峰期(PeakTimes)、新闻组(NewsGroups)、Email、其他页
面(OtherPages)。
下面对一些关键术语进行解释:
文件点击数(HITS)
早期的 INTERNET 是一个文本(TEXT)的世界,HITS 就是那个时代的产物。具体地说当时衡
量一个网站的访问量,一个页面的文本(TEXT)就是一个 HITS,但是自从 WEB等网络新技术
发明以后,INTERNET已经成为包含图片、动画等多媒体信息的超媒体(HYPERMEADIA)。每个
文件从站点服务器中被请求(REQUEST)一次就是一个 HIT纪录,一个页面包含 1幅图片,一个
动画,一段文字,一段声音,那么此时这个页面的 HITS 数不是 1 而是 4,如果一共有 10 个
人访问了这个页面,总 HITS 数就是 40。很明显,HITS 只表示被请求的文件数,而不能反映
出有多少人访问了站点。而如果运用了框架(FRAME)等技术后,HITS 数就更复杂了。因此
拿 HITS 作为衡量一个网站的客流量的标准显然是不合时宜的。而在国内网络的初期,大多
数的网站就是实行的这种统计标准。因为当时国际上早已抛弃了 HITS 这个衡量标准,国内
网站利用大多数客户知识的缺乏的行为,是极其错误的,一个新产业或新市场的培育如果没
有良好的职业道德的廉耻,最终损害的还是自己的利益。
在某一规定的访问时间内,访问网站的用户。但为了更精确鉴别,一般会利用让用户填写登
记表格或向用户硬盘中放置 COOKIE来鉴别唯一用户。
日志(LOG)文件把每次被请求的超文本文件都会做一个记录。这比 HITS要有价值,因为请
求可以告诉你这个页面(除去图片)被下载的次数。
访问(VISTT)
用户进入站点对服务器进行系列的请求就形成访问,用户的访问的过程是通过其 IP 地址鉴
别的。来自同一个 IP 地址的用户(UNIQUEUSER)在一个规定时间之后如果没有新的请求,
以后这个用户新的请求将被视为是新的访问(VISIT),这个规定间隔时间是 15 分钟到 1 个
小时,平均时间大约是 30分钟。
唯一访问者(UNIQUEVISITOR)
唯一访问者是指在一特定时间内第一次进入网站,具有唯一访问者标识(唯一地址)的访问
者。这一特定时间建议为一整天。它的计算方法是:在同一天内,只记录第一次进入网站的
具有唯一访问者标识的访问者,在同一天内再次访问该网站则不计数。
但为了更精确鉴别,一般会利用让用户填写登记表格或或向用户硬盘中放置 COOKIE 来鉴别
唯一用户。
访问长度(VISITLENGTH)
一个用户访问某一个站点的时间。
引进页面地址(REFERRINGURL)
用户进入某个站点的前一个 URL地址或页面。
IP地址(INTERNETPROTROLADDRESS)
所有连入 INTERNET 的电脑都会被分配给能够鉴别这台机器的唯一的一个数字和主机名,用
户的这个 IP地址是这个被请求的机器或代理服务器的地址。WEB服务器有一种内置的把数字
IP地址翻译成实际的主机名的功能,当报告域名级别信息的时候,这些数据是很必要的。一
个唯一的 IP 地址指的是访问站点的电脑,而不是某个个人,因为一台机器可能被几个人共
用,所以用 IP地址的数目来衡量用户的规模是不精确的。
总印象率(GROSSEXPOSURES,IMPRESSIONS)
它表明了一个广告被看到的总次数。
页面浏览数(PAGEVIEWS)
某一个服务器成功传递的页面被请求(REQUEST)的数目,它不能被用来判断用户看到的一
个页面确实的信息量,用户发出请求看到某个页面,但他可以关掉图片显示,甚至根本没有
看到标题广告。
点进(CLICK-THROUGH)
用户点击一个热链(HOTLINKED)的标题或按钮的广告,就叫做点进。点进率(CLICKRATE)
的算法是点击广告的次数除以广告印象次数(IMPRESSION)乘以 100%。
用户代理(USERAGENT)
用户代理(或浏览器类型)是用来鉴别发出请求的浏览器的类型,用户代理尤其在鉴别商业
机器人(ROBOTS)和个人蜘蛛(PERSONALSPIDERS)时非常有用。
文件类型(MIMETYPE)
MIMETYPE 指的是被请求的文件的类型,通常的类型,文字是超文本(HTML)、图片的 GIF、
JPG,视频的 MPG等,这些数据被用来鉴别那些正在被处理的 LOG文件的有效记录。
COOKIES
是服务器在用户的现在和以后的访问的过程中试图鉴别某个用户,而连接(ATTACH)某个用
户的信息。这个数据通常保存在客户机的硬盘里,而不是服务器中。大多数的浏览器都支持
COOKIE。
域名(DOMAINNAME)
域名系统是一种把数字 IP 地址翻译成具有友好界面的文字形式的电脑命名系统。域名是由
顶级域名和二级域名组成,
顶级域名包括商业站点用的.COM,教育用的.EDU,详细请看表格.军事组织用的 MIL,网络服
务组织用的.NET,非盈利性组织的.ORG,政府机构用的.GOV,在美国之外的国家需要国名代
码的二级域名,中国的代码是 CN,日本是 JP 等。这些域名分类被用在网站地址和邮件地址
中,通常一个完整的地址还包括组织的名称,如:.。
.COM 商业
.EDU 教育组织
.GOV 政府部门、机构等
.MIL 军事
.NET 网络
.ORG 组织和协会
一个 Cookie 文件的组成部分
.FIRM 商业企业
.STORE 贩卖商品的企业
.WEB 和网络有关的
.ARTS 和艺术、娱乐有关的
.REC 强调再生产/娱乐活动
.INFO 提供信息服务的
.NOM 单个或者个体术语的
而最近的消息:互联网标准组织--互联网工程任务组(IETF)发布了一份工作草案,预留了
四个新的互联网顶级域名。这四个新的互联网顶级域名严格限制在测试和范例的使用之上,
包括:“.TEST”,“.EXAMPLE”,“.INVALID”和“.LOCALHOST”。其中,“.TEST”用于
和 DNS测试相关的代码;“.EXAMPLE”用在文件或其它范例之上;“.INVALID”用于显示无
效的域名(如那些使用空格或省略符号的域名);“.LOCALHOST”则用于那些指向用户自己
电脑的域名。不过,据知情者说,推出这些新顶级域名的初衷虽然不错,在理论上也确实需
要,但目前顶级域名领域所具有的错综复杂局面,却可能使它们的具体实施变得遥不可及。
关于域名的价值
在域名登记机构注册一个域名的代价是很低的,在中国即使代价比美国高,也不过一年 600
元人民币左右。在中国,关于域名的认识问题的偏差来自两个方面:一个是传统的企业不重
视域名,或者说是还没有意识到这个领域对它的价值,因此就发生了 1997 年大规模的抢注
域名事件,中国的知名品牌的域名都被一家深圳的公司抢注。虽然最后主管部门干预制止了
抢注,但是中国的绝大多数不管是有名还是无名的传统企业仍然没有注册域名,政府或者主
管部门的干预只是市场发育初期或者市场没有形成完全的做法,我们都听说过一个公司为了
争取自己想要得到的域名而不惜花上千万的巨资的代价,如果中国的传统企业仍然不能迅速
行动的话,代价是要么换名,要么以远超过实际费用的价格购回;而另外一种发生在中国网
络界的怪事就不得其解:人人都知道 8848 是一个电子商务网站,但是各位还记得你上的是
哪 个 8848 吗 ? 准 备 在 NASDAQ 上 市 的 的 名 气 最 大 , 此 外 中 国 还 有 :
,8848.,8848.,这些网站可不是 的镜像站点,它们都从属于不同的公司,
宁愿花巨额的广告费乱扔一气,而不知会有多少人看了广告之后会想当然地访问
或者 8848.,可是网络企业!?
另外一种情况也只有中国才会有的怪事。在中国排名前十位的站点中竟然有 2 个 163,
(新飞网)、163.(网易),各位访问的是哪个 163?本来 也是 163.原掌
门人丁磊注册的,后来丁磊卖给了广州电信局。 主要提供免费电子邮件服务,而后
来 163.也提供免费电子邮件服务,的用户会想当然的敲入 163.,163.的用户也会经
常误入 ,也许两家网站想因此达到交互推广(cross-promotion)的目的,但它们不
知这会招惹用户的不方便,甚至是不满,这对基础脆弱的中国网站来说都是致命的。但愿两
家会有一个两全之策来圆满解决这个问题。
案例分析
一个域名竟卖出 750万美元高价
网址何价?一名于三年前以 15美元买下网址的美国人,昨天宣布已经以比买入价高约 50倍
的 750万美元将该网址卖出,成为历来最大宗的网址买卖。
据港报报道,独具慧眼的奥斯特罗夫斯基在电话访问中表示:“我是个靠买卖高科技维生的
人,在我出生至今的 38 年,我已借此赚了许多钱。做这门生意,要用脑,要明白市场需
要。”
买方 ECOMPANIES 的主席瓦恩鲍姆则觉得网址物超所值,因为公司能因此省回数百万美元的
广告开支。他计划用网址帮助其他公司搞网上商业,从中牟利。奥斯特罗夫斯基三年前以 15
万美元从一家英国网页公司买来 ,在当时来说,以这个价钱买下一个网页实在
是天方夜谭。他说:“人人都笑我是傻瓜┅┅但我没有理会,因为我比他们更了解市场。”
以 750万美元卖出一个网址是同类买卖的最高纪录,不过看来这个纪录维持不了多久。一间
网址拍卖公司的发言人表示,他们近日负责拍卖一个名叫的网页,有买家出价超过 750万美
元,只是卖方觉得出价太低而无动于衷。
网址这种“虚拟地皮”变得愈来愈值钱。今年(99年)五月,委内瑞拉一家公司用了 100万
美元买了一个名叫 WALLST(华尔街)的网址;去年康柏电脑公司亦花了 335万美元买下网址给
旗下的同名互联网搜寻器;而 2000 年初在香港股市引起抢购风潮的,这个域名还是从美国
的一个叫 TOM的年轻人那里花 2000多万港元购买的。
新闻报道
NETWORKSOLUTIONS开始受理广告域名注册
通过 NETWORKSOLUTIONS(NSOL)的域名注册服务,公司可以开始对其广告标语进行注册。
该公司受理的域名长度现已增至 67个字母,此前域名长度限在 23个字母以内。该公司副总
裁沃尔福德(DOUGWOLFORD)说,「现在公司可以对其产品和宣传语进行域名注册,以便将网
路流量引向其主网站。」
据 NETWORKSOLUTIONS统计,最受欢迎的域名长度在 8至 12个字母之间。
该公司受理的注册域名中,有 45%的长度在这一范围内。目前 Nike公司已经为他脍炙人口的
广告语——“justdoit”专门注册了域名。
网络广告测量标准
内容传递的层次
网络中,传递链中有 4个层次:
请求(request):浏览者向服务器请求传递特定的内容;
下载(download):服务器发送了所要求的内容;
传递(delivery):浏览者接受了所要求的内容;
观看(view):传递的内容在浏览者的屏幕上显示出来;
目前的技术能力,网络测量所能到达的层次只能到传递(delivery),并且主流的测量还是
围绕下载(download)的,最后一步,受众是否观看到广告,还不能解决。
网络广告的基本测量单位
最近,网络广告局(IAB)的媒介管理组出版了他们的指导网络广告测量的“度量和方法”
一文。而同时,广告支持的信息和娱乐联盟(CASIE)也出版了网络营销的词汇表。
5个基本的网络广告测量用语
5个基本的网络广告测量用语是:VISITOR,VISIT,PAGEVIEW,ADVIEW,和 CLICK。
访客(VISITOR)
就是访问网站的用户。当网站收集了他们更多详细的信息(例如,名字,年龄,邮政编码,
访问频率,访问路径的模式等)时,访客对广告主的价值就增加了。
计算访问人数比计算页读数难得多,而且没有绝对可靠的计算访问者人数的方法。
基本上有三种信息可以用来跟踪访问者:IP地址、成员名(如果网站使用成员注册)和 COOKIE。
最简单的办法是计算 LOG文件中的唯一(unique)IP地址的数量。不幸的是,最容易的办法
通常不是最好的办法。这种方法是可用的最不准确的办法。大多数人在每次连接时得到不同
的 IP地址。
这是因为很多 ISP为用户赋予动态的 IP地址,例如,当一个 AOL用户上网时,AOL给他一个
IP地址,当他断开连接时,AOL把这个地址赋给另一个用户。这样,当你进行统计时,你不
知道这是两个用户。
如果要求用户使用成员身份登录,统计将很容易和准确。但很多人不喜欢需要登录的网站。
最后,可以使用 COOKIES。为每个访问者定义一个包含唯一值的 COOKIE,我们把它称为机器
ID。如果某人访问你的网站时没有提供机器 ID(可能她是第一次访问,或者她的浏览器不接
受 COOKIES),把她当作新用户,并为她访问的页发送一个 COOKIE。
一般来说,网站综合各种因素会采取以下步骤来计算用户:
如果计算一天的访问者数量,我们计算成员名。
对于没有成员名的点击,我们计算 COOKIES。
对于既没有成员名,也没有 COOKIES的点击,我们计算 IP地址。
如果计算多天的访问者数量,一般只能用 COOKIES。如果只关心某一天的数据,可以用处理 LOG
文件的程序,如果希望得到多天的数据,应该把它存储在数据库中。
专家视点
注册会员较忠心 1
网站经营者最常思考的问题之一是:如何让网友持续地上网站来?
如果可以透过一纸证书让网友宣誓效忠呢?在开放的互联网世界里,这样的主意听起来很荒
谬。撇开创造忠诚度的方法不谈,根据 NIELSEN//NETRATINGS网络测量服务公司的长期监测
结果发现,在网站上注册过的网友其忠诚度比未注册的网友高,平均停留时间高出三倍,浏
览网页总数则高出三到六倍。这些的数字透露出不少商机。
此外,NETRATINGS的研究也发现,只要成为某家网站的会员之后,网友前往别家类似网站的
意愿就不会太高。
对于在今年四月间,上网时间中有 1/3 是停留在 YAHOO!的注册网友来说,他们花在 MSN、
EXCITE与 GO等其它网站的总时数还不到 5%。相信对于其它网站的注册会员来说,一定也是
类似的情况。
不管是创造广告收入、订阅收入或交易,互联网事业都需要有忠诚的网络族群才有成功机会。
要提高网友的忠诚度,并不需要网友真的宣誓效忠,只要能提供满足其需求的服务或内容,
再加上「注册」的动作,让网友将个人资料留下来,就可以加强其忠诚度。
以 YAHOO!和 ALTAVISTA来看,其注册过的网友大约是全体到访人数的十分之一。
数量虽然不大,但是却相当珍贵 NETRATINGS的分析师 PEGGYO'NEILL形容这些注册过的网友,
在广告主的眼中就好像是农作物的精华。
网站媒体经营网络广告时,可以根据年龄或嗜好等统计资料,进行更精准的广告递送,相对
的也提高网络广告的价格。
以华尔街日报为例,其一般网络广告价格的 CPM(每千人成本)订在 51美元,而在注册会员
的活动范围内,其 CPM定价可以高达 72美元。
长期以来,网站经营只着重在提高网站到访人次以创造广告收益,而忽略网站流量的品质,
但是随着广告主的需求日益增加,网络族群分析、重复的到访人次和停留时间也将成为另一
个评估的重点。
访问(VISIT)
就是在某一段时间(一般是 30 分钟内)向站点发出请求的行为。所以,当你去《网络评论
站》的时候,当阅读《成功的跟踪》一文的时候,中间接听了一个 45 分钟的电话,这么你
请求的下一页就被算作下一次访问的第一次请求。访问时间的限制对获得的即时的内容将变
得十分重要。例如,我经常在一个小时里访问 NASDAQ这个站点两次来观看更新的市场信息。
对我来说,这些都是很谨慎的事件。因此,NASDAQ 就会比 NATIONALGEOGRAPHIC 有一个较紧
1蔡明哲文
的时间限制。和访问时间有关的是首次访问和重复访问的区分。你第一次访问站点,你是在
试验,这算作试验访问。以后的访问算作重复访问。(这和传统的消费品营销的概念是一样
的)由于标题的损耗的问题,不同的广告主对重复访客的价值的认定是不同的,——如果用
户在看了一个标题 4次以后还没有行动,它将永远就不会。
页面浏览(PAGEVIEW)
是用户访问页面内容,这和观众收看电视节目一样。你不能保证他们都很注意,但是假定当
他们请求页面的时候,他们将会看到,这是合理的。关于测量,是否用户完整地观看了页面
还有很多的技术问题,传递的技术问题,用户关闭图片显示,他们是否厌烦等候下载,或者
页面是否被存在了缓存中。
广告浏览(ADVIEW)
是用户观看了插入到页面中的广告——它们可能在页面的最上方。许多的页面不止一个广告,
所以一个站点的广告浏览的总数要比页面浏览总数要大。页面浏览面临的所有问题,广告浏
览也同样存在。.
点击(CLICK)
就是用户点击链接物体。点击通常把用户带到了另一个页面或者站点。点击对广告主来说是
很有意义的,因为用户是通常点击广告被带到了广告主的站点。
网络测量,尤其是网络广告的测量现在是一个热门话题,因为人们都说网络最大的优势就是
可测量型和营销的直接效果。关键之处是技术,目前的技术能力还不能完成对营销者很有意
义的测量,除非用户被迫登记留下了信息。很明显,被迫的登记使隐私权的维护者和激进的
用户都有意见。因此,像 IAB和 CASIE这样的行业组织,尽力都在使现在的测量用语和方法
标准化,所以每个人至少可以在站点和在线活动之间进行比较。我希望当网络作为营销工具
逐渐成熟的时候,营销者能够像看 NIELSEN的收视率系统一样,习惯于这个媒介所的测量假
定。与此同时,用户的期望在改变,使他们非常舒服地服从有限的个人信息或者他们所不具
有的经验提供给站点。最后,软件开发人员将努力改良用户(或者用户的工作站)和网络服
务器之间的信息的质量。也许促使测量技术改变的最好的催化剂将是钱。
测量的基本框架
访问者(VISITOR)
未鉴别访问者(UNIDENTIFIEDVISITOR).访问者是访问站点的个人。“未鉴别的访问者”意
味着没有访问者的信息。
载具级别 页面级别 广告级别
分析单位 站点 部分站点或者页面 赞助商的广告页
对应传统广告用语 到达率/接触频
次
发行量
接触频次
总印象数
回忆率
认知
收视率
现在曝光测量标准 每天访问的站点
数
基于收视率的访
问的站点
每天访问的页面数 每天访问的广告页面
数
过程访问者(SESSIONVISITOR).过程(SESSION)中身份鉴别(ID)是可知的(例如 COOKIE
或者象征标志)或者可以推断(例如进入 IP地址和浏览器类型等),这将使访问者访问某一
个站点时的反应可以被跟踪。
跟踪的访问者(TRACKEDVISITOR).身份鉴别(ID)是可知的(例如 COOKIE),这将使访问某
一个站点时的路径可以被跟踪。除了身份鉴别(ID)之外,再没有访问者其他的信息。
鉴别的访问者.身份鉴别(ID)是可知的(例如 COOKIE、志愿登记等),这将使访问站点的路
径可以被跟踪,访问者可能会提供会志愿提供其他的信息(例如名字、人口统计特征等)以
和身份鉴别(ID)联系起来。另一种获得可鉴别访问者的方法是使用网络样本调查(例如
WEBTV或者 PCMETER),它们能够完整纪录访问者的行为。
网络内容
标题广告.(BANNERAD)标题广告的介绍读者可参阅第二章《网络广告的组成》
目标广告.(TARGETAD)从单个的网页到完整的企业站点的完整的广告。
网页.(WEBPAGE)包含文字、图片和其他媒介形式的的超文本页面。
访问.(VISIT)访问者访问站点索取的一系列网页。一旦访问者在一定时间停止索取(通常
30分钟),这个访问者的下次索取将会被视为一个新的访问。
过程.(SESSION)一个访问者在一系列站点进行的一系列访问。
其他
持续时间.(DURATIONTIME)在两次事件之间持续的时间,例如对网页的一系列索取(页面
持续时间)或者对特定站点访问(站点间持续时间)。
多站点数据.(MULTI-SITEDATA)身份鉴别(ID)是可知的,这将允许可跟踪或者鉴别访问
者(TRACKED/IDENTIFEDVISITOR)在多个站点访问时都能够被跟踪。
载具级别 页面级别 广告级别
曝光率测量标
准
站点曝光率
站点曝光重叠率
站点到达率
站点接触频次
页面曝光率
页面到达率
页面接触频次
标题广告曝光率
标题广告到达率
标题广告重叠到达
率
标题广告接触频次
标题广告访问频次
交互测量标准 访问持续时间
访问之间持续时
间
访问深度
页面持续时间 广 告 点 进 率
(clickthrough)
广告点进到达率
广告点进接触频次
广告重叠点进率
标题广告持续时间
其他的测量结构
除了基本的测量结构之外,在网络测量中还有一些我们应该注意的统计标准。我们简要介绍
如下:
通过站点的主要导航模式
站点间的导航模式
访问站点或者网页的访问者的人口统计特征、心理统计特征和行为特征。
认知和态度测量,包括流向。
访问者忠诚度和重复访问。
以结果为基础的测量标准
我们现在的测量标准和相应的计费标准都是把网络和传统的大众媒介一样对待的,但实际上
它们并不一样。网络自身所具有的优势和特点,使它完全可能成为一种直效行销媒介。美国
直销协会 1996年对直效行销定义如下:
任何以获取定购(直接定购)(DIRECTORDER)、索取详细信息(LEADGENERATION)、访问店面
或者其他的特定产品或者服务的购买场所(TRAFFICGENERATION)为目的针对消费者或者企
业的传播活动。
根据美国直销协会定义,“直接定购”、“获取导引”、“产生流量”是直销行销活动的主要目
的,那么我们就可以把它沿用到网络媒介中。
网络测量中的广度和深度
网络广告测量中收集访问者数据的方法有两种,服务器中的日志文件分析是关注深度,理论
上讲,它能够提供访问站点的完整的流量记录。当然,用户浏览器中的缓存和 ISP服务器中
的缓存网页都会造成记录并不完整,它会低估真正的流量。但是如果用户在站点登记或者利
用 COOKIE进行跟踪,人们还可以组合多个站点之间的深入数据。
宽度的方法是使用网络用户固定样本组(例如 MEDIAMETRIX的 PCMETER),它能够跟踪一定时
间里样本组访问多个站点的行为。样本组是由代表一个较大的目标人口群的网络用户组成。
关于广度和深度我们这样总结:收集所有的访问者访问个别站点的信息是深度的方法;收集
个别访问者(样本组)访问几乎所有的站点的信息的方法就是广度。下面我们将分别对这两
种方法的操作流程和相应的公司进行介绍。
测量日志(LOG)文件的方法
WEB服务器产生的 LOG文件被认为是所有活动的源数据,LOG文件最少应包含下列数据信息:
用户的 IP地址。(当报告顶级域名信息时辨认的主机名字)
发出请求的时期和时间戳(STAMP)。
请求的方法(GET,POST,HEAD)
请求的地址(REQUESTEDURL)。
状态编号(STATUSCODE)
数据传输的数字(NUMBEROFBYTESTRANSFERRED)
引进的地址(REFERERURL)
用户代理(USERAGENT(BROWSERTYPE))
文件类型(MIMETYPE)(可选)
来的 COOKIES(INCOMINGCOOKIES)(用后)
出的 COOKIES(OUTGOINGCOOKIES)
注册识别者(REGISTRATIONIDENTIFIER)
一些测量软件只能以通用(COMMON)格式报告 LOG文件的处理结果,但是一些通用格式之外
的 LOG 文件对精确地计算和审计 WEB 站点活动是很必要的。LOG 文件提供了服务器处理的关
于每个文件或交易的特定数据,建立适宜的程序给 LOG文件归档以实体化(SUBSTANTIATE)
是很重要的。
分析媒体网站日志文件的目的对网站来说能够调整自己的服务内容,从而更好服务用户;对
广告主来说加了解网站的结构,也增添了对网站的信任。对广告人和营销人员来说,通过分
析日志文件,使媒体计划更加科学,代理客户发布广告更加有的放矢。简单地说,他可以根
据分析结果,发现最切合我们目标市场特征的用户访问时用的最多的关键字和最常用的访问
路 径 , 如 : 这 样 一 段 文 字 :
HTTP:GUIDE-P./TITLES?QT=BUSINESS+ECONOMY&COL=WW&SV=N2&LK=NOFRAMES,营销人员就会
知道用户是通过搜狐()的工商经济(BUSINESSECONOMY)这个目录进行请求的,那么我们
就可以只买这个目录的广告,而不必撒大网。现在分析日志文件的做法是运用软件,就目前
软件的能力来说,虽然已经帮助我们解决很多的难题,但是不管是功能还是标准性来说,还
有提高的余地。方法大体可以分成两种:内部(INHOUSE)分析和外包(OUTSOURCE)。
内部(INHOUSE)分析
网站自己购买或开发软件,分析、跟踪站点的客流和用户的来源及构成情况。
外包(OUTSOURCE)
网站当作为一个媒体存在的时候,赞助商需要一个他认为的公正客观的站点详细的客流量、
受众构成的情况,处于习惯的思维,站点自己的数据报告此时就不足以让赞助商放心。而且
对有多台服务器群或服务器分布在不同地区的规模较大的网站来说,为了省去繁重的时间和
精力,不得不雇佣一个第三方(THETHIRDPARTY)的公司去分析它所有的站点数据。第三方
一般是一个独立的网上监测公司,他们把从一个网站收集并加以处理的日志(LOG)文件产
生一个分析报告。著名的第三方的网上测量和监测公司有 WEBTRENDS、I/PRO()和 NETCOUNT
()等。
第三方监测和测量的好处主要是平息了广告主和代理公司的质疑,代理公司常把网站内部
(INHOUSE)的测量和第三方的测量与电视台公布的数据和 ACNIELSEN 的收视率报告的数据
做比较。任何人都知道通过篡改日志文件,文件处理的任何作弊行为都会批量地增大它的客
流量,在大家的印象里,第三方是不可能篡改日志文件的。但是第三方的监测和测量并不是
审计(AUDIT),有时很可能也会被操纵。广告主们懂得多了,网站网上的监测和跟踪测量可
以分为实时的(REALTIME)和历史的(HISTORIC)。实时的情况是第三方把监测软件放置在
网站的服务器中,历史的监测是网站把过去的一个月或一周的 LOG文件拿到第三方那里进行
处理。
日志文件的结构
流量测量的信息来自哪里?
从服务器的日志文件中收集数据。服务器是一台直接和主持站点的网络连接的电脑,服务器
的日志文件记录了服务器中发生的活动,每次当用户请求页面的时候,一个组成那个页面的
(文字、图片等)一条线的目录被编辑起来。因为一台服务器能够主持许多站点,已经开发
了软件来解释属于同一个服务器主持的每个站点的数据。日志文件是超级电脑应用全国中心
开发的,尽管发生了一些变化,它取决于服务器的类型,这种信息在不同平台上有着连续性。
日志文件中有什么数据?
平常的日志文件中收集的数据包括这几个最基本的元素:请求的时间和请求的文件名字。可
得到的延伸的日志文件中的信息(许多服务器支持能够提供更多信息的延伸日志文件格式)
包括:使用的浏览器类型,引入用户的链接地址。到目前为止,日志文件还不能提供足够的
信息使营销人员来研究用户通过一个站点的完整路径。对这种形式的信息,营销者必须用分
析软件,它能够翻译日志文件,通过相配主机的名字、日期和请求的时间来判断用户在一个
站点的完整活动。
从挖掘日志文件中能够得到什么信息?
利用软件来分析日志文件能够得出:什么用户访问站点,它们浏览信息是在什么时间,他们
来自哪里?他们从这个页面退出?(这一章的后面我们将详细地描述日志文件分析的好处)
测量软件是如何产生报告的?
这取决于使用的程序。一些软件提供最新的日志文件的固定报告,而一些成熟的软件把最新
的日志文件合成到仍然包括过去的日志文件的数据库中。这将是营销者运算这些数据成为可
能,并且能够产生几个月的流量趋势报告。
报告的条目
日志文件产生的信息提供用户在站点的行为:显露了什么,何时,多长时间。下面列出了从
典型的日志文件中可以得到的信息。
访问的综述:流量的总体的印象数。
每次访问的页数和访问的长度:提供用户对你的内容感兴趣的程度。
在首次和重复访问者之间的区别:帮助你理解是否有一个顾客忠诚的基础。
最常用的时间:让你知道每次在什么时间更新可以到达最多的观众,也可以告诉
你服务器运行的最佳的时间。(当你又不错的客流量的时候)
最常访问的页面:鉴别你的用户最感兴趣的内容,可以提示你如何分配你的内容
资源。
最不经常访问的页面:提示你不要在那里分配过多的资源。
浏览你站点的最常用的路径:给你一个检查用户浏览你的站点导航的改变框架。
点进率:提供给广告主的重要的数据。你可以了解你的站点的哪一个页面的广告
产生最高的反应和不同的广告的表现。
使用的浏览器:帮助你如何地设计你的站点。如果大多数的用户都是使用
NETSCAPE,你的站点应该是使用 NETSCAPE浏览是呈现最好的外观。
引入(REFERRAL)的地址:如果访问者点击一个连接或旗帜广告到达你的网站,
他的浏览器会随着这个请求发送他刚离开的站点的 URL,这个 URL称为"REFERER"。它能够告
诉你的用户来自哪里;这是最好的跟踪链接地址和广告效果的最好的方法。最好的流量来源
不是广告产生的,而通常是那些值得投资广告机会的站点。
为了使我们的生活变得更困难,NETSCAPE和 MICROSOFT对访问的来源的处理方式不同。尤其
是,如果你点击一个页到一个有 FRAME的页,NETSCAPE将把原始页作为对包含 FRAME的页和
每个 FRAME中的页的来源。IE把原始页作为包含 FRAME的页的来源,这个包含 FRAME的页反
过来把它本身作为各个 FRAME页的来源。
这里有一个这种情况的例子,它包括以下文件:
<HTML>
<BODY>
<AHREF="">CLICKTODISPLAYTHEFRAMESET</A>
</BODY>
</HTML>
<HTML>
<HEAD>
<TITLE>EXAMPLEFRAMESET</TITLE>
</HEAD>
<FRAMESETCOLS="50%,50%">
<FRAMENAME="LEFT"SRC="">
<FRAMENAME="RIGHT"SRC="">
</FRAMESET>
</HTML>
#!LOCALPERL
PRINT<<END;
CONTENT-TYPE:TEXT/HTML
HTTP_REFERER=$ENV{HTTP_REFERER}
END
如果跟踪有 FRAME页的来源,就要对不同的浏览器做不同的处理。
用户的域名:提示你的用户是属于哪一个领域:是商业领域、教育或者其他。这
也许是非常重要的提示:企业对企业的站点的大部分用户却来自教育页,那我们知道到达了
错误的受众。
用户的电脑平台:提供关于电脑或者软件的生产者信息。
用户的进入页:让你知道那一个页面必须让用户有一个“受欢迎”的感觉,用户
并总是从你的主页进入站点,知道了他们从哪里进入站点,将提示你花力气设计一种有吸引
力的页面。
用户的退出页面:将会提示你要重新设计那个页面以阻止用户的离开。
这些信息将帮助你调整你的站点来更好达成你的商业目标。
广告传递的原理和测量应用
为了理解现在的交互广告不同的传递方法,以及这些方法是如何影响测量的,CASIE 于是请
发行量审核局(ABC)的 RICHARDBENNETT就这个主题进行了论述。DICK是 ABC和 ABC交互部
门的高级副总裁。这一部分将描述服务标题广告的不同方法和用来解决诸如缓存(CACHE)
引起的测量问题不同的技术。
广告服务和跟踪
这一部分将简单地描述现在我们主要用的 5种的广告服务和跟踪方法。它们分别是:静止广
告,插入,动态广告,测量缓存的广告,测量浏览器的广告。在我们在深入地探讨广告传递
系统的细节的时候,我们先把这些步骤简单地描述如下:
I. 用户向内容站点的某个页面发出请求
II. 内容站点要求广告插入页面中
III. 广告插入页面中
IV. 广告下载到用户的浏览器中
V. 广告在用户的屏幕显示
VI. 用户观看广告
上面所有的步骤除了最后一步都可以被测量,点击率、点进率(CLICKTHROUGH)、点阅率
都是描述广告被观看的词语,但是仍然有许多的广告不能够被测量。
上面的第 5部是满足广告主和代理公司测量需求的必要的一步。
下面我们将列出等于上述的几个步骤的 5种技巧:
第二步:要求=缓存测量的广告
第三步:插入
第四步:下载=静止广告或者动态广告
第五步:显示=浏览器测量的广告
要特别注意的是:下面的描述不是为了界定出是否广告被和网站或者广告服务器发生交互的
人请求,或者广告是否被自动推到用户的浏览器中。这个问题可以被动或者主动地建议一些
词语来说明。
固定的广告
这种方法的特征是通过发布 HTML语言的页面里的图像标记中的广告文件的名字,在 HTML页
面调用完之后,用户的浏览器然后向图像(广告文件)发出要求,这些将被记录在服务器的
日志文件众。这样网络服务器将记录下被要求的页面和广告。除此之外,服务器也将能够记
录下广告文件被成功的和不成功的下载的纪录,它的完成是通过依靠 INTERNET 的 TCPIP 协
议的状态码来处理这些请求。采用这种技术是那些没有广告轮换和服务器系统的站点,或者
是内部的应用。
采用这种技术的站点成批地发布和轮换广告,例如,他们也许每天运行程序一次用准备在页
面显示的适宜的图像(广告文件)名字来给站点中的每一页做标记(TAG)。当广告文件被服
务的时候,用这种轮换的方法记录的广告活动被站点的服务器完成。
但使用这种技术的时候缓存对策量将要重要的影响,如果站点采用了较低的或没有采用防缓
存的技术,那么这种测量方法将因为缓存的问题低估活动数,因为任何对网络中的元素的请
求经过代理服务器的时候,那么发出请求过的元素将被存在缓存中,网络服务器将很可能看
不见或者不能记录它。
插入(INSERTION)
利用这种技术,广告服务器软件和网络服务器软件发生交互,那么当页面到用户的浏览器的
时候,那么将决定哪一个广告来服务这个发出请求的浏览器,然后选择的广告的超文本编码
INTERNET
代理服务器
PC 浏览器
日志
文件
缓存
日志
文件
网络服务器
将被插入页面的源码中。利用这种方法跟踪服务的广告将在广告服务器决定了被服务的广告
的 位 置 完 成 。 现 在 许 多 的 广 告 管 理 软 件 都 使 用 这 种 方 法 , 比 如
ACCIPITER,NETGRAVITY,REALMEDIA等。关于这种技术的一个重要的问题是广告实际的传递没
有被记录那么因此也就没有被测量。
用这种技术测量广告将导致几个方面的不精确:首先,浏览器设置中可以把图片文件的显示
关闭,那么将阻止向广告发出实际的请求,因此用户永远不会暴露于广告,即使软件记录和
测量了广告请求。第二,当站点页面是来自缓存中的时候,广告服务器软件将永远没有机会
完成广告的插入,那么将导致显示的广告不能轮换或者不能被广告服务器所记录。这将导致
低估广告活动的实际数目,也会导致意想不到的广告轮换。
变化的广告
采用这种技术的站点把标记嵌套到使从广告服务器中发出广告传递请求的页面的源码中,这
种广告服务器然后将决定显示哪一个广告和传递广告到浏览器中,当广告被服务、传递、下
载到用户的浏览器中的时候将被记录下来,一些广告服务公司和一些广告管理软件使用这种
方法。
这种技术和前面介绍的固定广告的方法有一些相同之处,不同的是固定广告是和特定广告文
件相关,而变化的广告是和广告服务器相关。那么使用这种方法时,广告被服务和测量的数
INTERNET
代理服务器
PC 浏览器
日志
文件
缓存
日志
文件
网络服务器 广告服务器
日志
文件
目将估计服务器服务的页面的数目,此时是假定所有的页面都有广告。当使用防缓存技术的
时候,这种方法可以紧密的估计浏览器中显示的广告。尽管一些精明的代理服务器使用这种
方法把广告存在广告中,关于这些代理服务器的数目和效果有一些不同的选择。
这种方法服务的广告可以导致和前面提到(固定的广告和插入)那些技术引起的测量有明显
的不同,缓存中的广告变化的程度和传递的广告的实际的测量于页面中被服务的广告文件的
插入有明显的区分。很明显,站点采用的防缓存技术越成熟,测量将越精准。动态广告服务
技术能够精确地处理浏览器关掉的图片的文件记录和测量。
背景报道
THINKINGMEDIA的网络广告追踪技术 2
当我们谈到网络广告计算基准时,一般都是使用广告曝光次数(ADIMPRESSIONS),但是除
了广告管理软件所提供的统计数字之外,有没有其它方式可以证明这个网络广告的曝光是完
整的?
THINKINGMEDIA公司的广告追踪技术可以提供我们解答。
ACTIVETRACK—THINKINGMEDIA所开发出来的广告追踪技术,可以保证广告主所购买的每一个
RICHMEDIA 广告确实出现在浏览器上。这个技术已经获得美国广告代理商协会(AAAA)、媒
体购买公司 WESTERNINITIATIVEMEIDA、广告研究基金会(ARF)和奥美广告集团的青睐。
THINKINGMEIDA 的 ACTIVETRACK 技术使用于客户端,当浏览器索取网页内容及网络广告的同
时会下载一个 JAVA小程序,这个小程序会监控广告资料从广告主机下载到客户端的浏览器,
并确认广告是否已实际下载完成。
而目前称霸市场的主流技术通称为「服务器端技术」,比如 NETGRAVITY、DOUBLECLICK、
ADKNOWLEDGE、MATCHLOGIC等,只能计算网络广告被索取的次数,并不能完全保证 RICHMEDIA
广告完整递送到使用者的浏览器上。
有了 ACTIVETRACK追踪技术后,对于了解网友之于网络广告的态度有更进一步的认识,许多
的广告代理商将 THINKINGMEDIA 视为网络广告的未来,美国 AAAA 的执行副总 MIKEDONAHUE
说,「如果我们可以直接在使用者的计算机上测量广告,那么网络广告的测量技术已经几近
完整。」
根据 ACTIVETRACK 的统计资料显示,网友在广告图档还没有出现之前有 18%到 42%的机率会
选择离开该网页。在广告图档出现而内文尚未出现之间的 10-20秒,是网络广告最主要的点
选时间,而且广告出现时间愈久,点阅率也愈高。
从 I/PRO 和 WEBTRENDS 的网站流量分析、MEDIAMETRIX 和 NETRATINGS 的网站媒体稽核、
NETGRAVITY和 DOUBLECLICK广告递送管理、到 THINKINGMEDIA的网络广告追踪,从来没有一
2蔡明哲文
个新媒体必须不断透过新技术来证明自己的广告价值,而这个「可测量」的特性对于网络广
告来说,是幸运也是不幸!
网络测量的问题
作为一个快速成长的新的行业,存在一些诸如测量的问题是很自然的。一个重要的困难就是
需要克服技术的障碍——某些能够扭曲数字的精确性的领域。问题还有就是还缺乏行业的标
准,这样会导致测量的数据会有误解,并且很难进行比较。最后,网络测量需要通过公正的
第三方审计来建立行业的信用。
技术的障碍
一些本来是用来帮助加速网站速度和保障企业安全的技术发展可以导致测量数字的扭曲。
缓存
缓存是用来缩减调用时间的储存在硬盘中或者服务器中的网页;它除去了用户每次请求的时
候调用同一页面的一步。现在市场中的许多的浏览器把用户最近浏览的页面存在用户的硬盘
中,一些大的网络服务提供商,如 AOL,把它的服务器中经常浏览的页面储存起来以节省它
的用户调用站点的时间。这在一些大的企业中也存在这种情况。
尽管这样能使用户更快访问信息,而当使用是在别人的服务器中进行的时候,网络媒体则不
能跟踪它的站点使用情况。例如,许多的 AOL的用户可以浏览一个站点,但是如果它是缓存
在 AOL的服务器中的,网络媒体将不知道这些活动。这有两个方面的原因。首先,网络媒体
没有站点的正确的使用数据,第二,如果网络媒体积基于印象数来定价广告的话,它将不能
将通过缓存传递的页面印象数收费,因为在日志文件中没有印象数存在的记录。
但是,缓存服务器保存了它缓存的数据的记录,并且这些数据在缓存服务器的日志文件中。
网络媒体并不反对缓存,但是他们必须能够得到缓存站点的日志文件,这样他们才能精确地
测量它们站点的活动。
代理服务器
为了维护企业电脑系统的安全,代理服务器扮演者从公司的防火墙内部到外部世界的网关。
从防火墙控制的 INTERNET 中请求信息必须先到代理服务器,它能够从网络中聚集原料。代
理服务器必须使用唯一的 IP 地址,尽管大的系统可能使用好几个。结果是网络媒体服务器
中的日志文件可能只能认成一个用户(代理服务器),而实际上公司中由许多的电脑从站点
请求了信息。这种情况出于安全的考虑是很难解决的。
对个体网络用户来说,选取适当的 PROXY将可加速信息传输速率,充分利用上网时间。甚至
可以访问您的 ISP 封锁的那些地址。在这种情况下,我们也不能侦测到真正用户的 IP 地址
来源。
另一种相似的情况也会发生,就是当几个人使用同一台机器的时候。这种情况在商业、学校、
科研机构和家庭中。例如,在一个小公司中,仅仅有一台电脑和网络相连,但是所有的职员
都是使用这台电脑上网。而在学校中许多的学生在实验室中使用同一台电脑时也会发生。在
家听众,家庭中的每个成员大多数都是使用一台电脑。结果是同一个 IP 地址将会出现好多
次,返回给站点的印象数是一个而实际上是好多个。这表明了通过 IP 地址来鉴别用户是有
缺点的,IP地址鉴别电脑,而不是用户。
机器人(ROBOTS).缓存和代理服务器的问题可以导致低估请求的数字,而机器人则夸大访
问的数字。一个机器人一天可能请求一个站点几百次,搜索引擎经常用机器人搜索网络中地
站点的每个页面而把它们加入到自己的数据库中。幸运的是,许多的测量分析软件现在已经
可以这种测量问题。
行业标准
毫无疑问,一个行业成长的痛苦是伴随着创造而来的标准化的问题。在许多方面,网络的测
量——从术语到技术,仍在发展之中。市场中新的测量软件每个月都会出现,缺乏行业广泛
接受的标准是这种问题的根源。这种混乱的延伸从术语到设计到定价结构。
关于报告,标准化也是很需要的,因为广告主可以比较不同网站的广告表现报告。
术语
任何成长的行业都会产生自己的术语,INTERNET 也不例外。INTERNET 有关于应用、程序、
产品的词汇表,在网络广告中尽管已经有一些用来描述程序和步骤的词语,但是缺乏的仍然
是行业广泛接受的意义。不幸的是,至今为止,INTERNET都不能形成标准,更不用说网络广
告业了。
因此,现在广告主和网络媒体必须统一这些词语的意义,同一个词对不同的人来说可能有不
同的理解,那样将会影响媒介购买的价值。例如,当基于“印象数”为客户购买广告的时候,
广告公司定义“印象数”是客户的广告被看到的次数。与此同时,网络媒介把“印象数”定
义为访问站点用户数。在这种情况下,客户的广告不会被所有的用户观看到,因为站点有好
几个广告主。那只又问站点“印象数”是如何定义的,广告公司才能发现它们购买的印象数
到底是多少。不同的网络媒体之间定义“印象数”也是不同的,一些站点计算印象数是用户
离开站点之前一个标题完整下载下来,而一些站点计算印象数是页面每次被观看到,而不管
在用户离开之前图片是否被完整地下载。
报告
在报告方面,站点之间的比较是最重要的。因为目前有许多的报告技术,因此保持报告格式
的统一性是很困难的。许多的媒介购买人员都肩负着从分离的报告格式汇总成统一的形式的
坚决的任务。现在,缺乏比较性是广告主不满的一个原因,也是从大的广告主那里获取投资
的一个障碍。
但是现在一些新开发的测量技术也可以解决缓存的问题,下面是其工作原理:
如何测量缓存中的广告?
这种方法对动态广告的方法进行了轻微的修改,它不是广告服务器把广告返回到浏览器中,
服务器直接传递,告诉浏览器显示广告,以及广告的位置。浏览器然后必须运行和接受广告。
广告请求在服务器做出广告决定的地点被记录并对浏览器发出指令。
这种方法允许大概的估计储存在代理服务器或者浏览器中和缓存提供的广告,它不测量传递,
而是特定广告的请求,和插入的方法有一些不同。
这种测量技术提供了上述的方法不能相比的统计,除非它们采用了防缓存的技术。设定正确
的时候,缓存测量技术能够精确地处理浏览器设置关闭图片显示的问题。
通过浏览器测量广告
这种技术允许通过在浏览器上运行软件来记录广告活动,浏览器测量广告采用的在浏览器上
运行的软件,象 JAVA,处理从服务器中要求广告、运行广告、记录运行的广告,以及把记录
活动返回到一个中央地带。
缓存是如何被控制的?
另外,在同一个目录的测量的区分可以以缓存的程度、破解缓存、缓存的测量来解释。破解
缓存指的是强迫网络中元素(页面或者广告)发送到到每个发出请求的浏览器。破解缓存可
以通过不同的方法来完成,平常用的破解方法包括:
I. 站点可以设置广告的过期时间到过去的某一个时间,例如 2000年 1月 1日,高
速缓存的广告过期了,那么代理服务器需要一个新的广告来满足下一个请求。
II. 站点可以各每个服务的广告一个独一无二的名字,因为每个服务的广告有不同
INTERNET
代理服务器
PC 浏览器
缓存 缓存
日志
文件
网络服务器
的名字,代理服务器鉴别同一个广告的请求时将有问题,那样将需要广告重新返回到服务器
中。
III. 站点可以设置其他的标题属性(HTTP 属性)以使代理服务器不能把广告存在缓
存中。这些标题包括:PRAGMA、没有缓存和缓存控制等。
当组合使用的时候,上述的那些技巧将能够大大缩减站点流量的缓存,现在的许多精明的代
理服务器都在苦练本领来忽视那些标题,而继续把它们存在缓存中。
在另一方面,缓存测量指的是从缓存中测量的能力。现在有两种测量缓存的方法。一种缓存
测量的方法上面已经讲过了,另一个方法是从所有的缓存某个网络元素的代理服务器中获取
服务器的日志(LOG)文件。
公布站点采用的破解缓存或者缓存测量技术,将会大大提高测量和审计报告中的用户评估的
统计质量。
远程数据跟踪
现在我们看看长距离的数据跟踪能为我们做些什么。
有些问题只能在看过经过一段时间后的数据后才能回答。
页读数增长的速度是多少?年底的时候我期望的页读数是多少?
网站的哪部分页读数增长得最快?哪部分最慢?
各种浏览器的比例随着时间变化的趋势是怎样的?
人们过多久访问我的网站一次?
从其它网站的旗帜广告第一次进入我的网站的人,他们随后读了多少页?
如果你对回答这些问题感兴趣,那么多天的跟踪会有用。如果考虑跟踪,可以考虑使用数据
库。
下面是可用的数据库产品的清单:
公司 产品
IBM DB2
INFORMIX DYNAMICSERVER
MSQL
ACCESSMICROSOFT
SQLSERVER
NCR TERADATA
ORACLE ORACLE8
REDBRICKSYSTEMS REDBRICK
SYBASE ADAPTIVESERVER
在选择数据库产品后,需要设计数据结构。幸运的是,这项工作比大多数数据库设计者的工
作容易。因为在 WEB统计中,需要存储的信息类型不多。
下面是设计数据库时要实现的一些目标:
最小化装载时间
最小化查询时间
最小化管理和维护
最小化数据库空间
要达到这些目的,需要做各种决定。例如,装载数据的时间取决于有多少数据要装载,是否
使用"LOOKUP"TABLES,数据库是否存储在 RAID系统中,等等。
这些目标之间有时相互冲突。例如,要最小化查询时间,将不得不建立和维护摘要表格,但
这时管理和维护的时间会增加,数据库的空间会增长。而且在做这些数据库决定时,别忘了
看你的数据的人可能希望把数据库中的数据与 WEB 数据库日志文件中的数据进行审核和比
较。
最后,如果你有设计数据仓库的经验,要保持清醒的头脑。它与你曾经设计过的任何数据仓
库都不同。你不知道访问者的域名是什么,他们用什么浏览器,等等。当你的用户在 FORM
中输入信息时,你不知道他们将输入什么。而且这些值的范围不能确定。
因此要选好工具,然后再进行跟踪。
你可以编写程序从点击数日志中提取想要的信息。当每天得到的点击越多时,就越有理由把
数据存储在数据库中:
如果数据库设计得合理,查询信息的时间比用程序从日志文件中提取信息快好多倍。
数据量越大,这种差别越明显。
如果只存储感兴趣的点击,可以节省大量的数据空间。
大多数人用 SQL从数据库中提取数据。SQL是一种小型的、简练的只需学很少的命令
和语法的语言。而且,其命令结构简单明晰,好的程序员建立一个 SQL查询比编程做同样的
事快得多。而且其结果错误更少,更容易理解。
如果不想用 SQL,可以用一种数据库访问工具(如 MSACCESSOREXCEL、CRYSTALREPORTS
或 BUSINESSOBJECTS)。这些工具都很好用,而且有图形界面。
也可以用应用程序开发工具建立自己的程序。DATA-上有很多这样的工具。当然你也
可以用你最喜欢的 3GL,其中很多提供了 ODBC接口和所有权 API。例如,在 WIREDDIGITAL,
我们用 PERL写我们的报告应用程序,用 SYBASE的 CTLIB和 DBIPACKAGE进行数据库访问。
行业审计的需要
和其他广告媒介一样,网络广告需要公正的第三方认证。独立的第三方审计将提供网络作为
合作化的媒介的基础。审计和以站点(SITE-CENTRIC)为基础的网络测量是不同的。网络测
量包括站点活动的定时跟踪,它由第三方提供者执行,也可以用站点自己的软件。在网络快
速发展的这一阶段,现在有很多的网络测量解决方案,但是没有被认为很精确的广泛接受的
方法。
电视业,NIELSEN提供从“当晚”到一周的收视率的第三方认证;ARBITRON提供电台的认证。
媒介购买人员使用这些数据来判断在哪、购买多少广告。相反来说,审计和核查杂志的订阅
数是一样的,它们核查这些测量过程和报告的数目以确保精确。审计不是即时进行的,而是
在稍后的时间,比如季度或者每年。
在美国主要有三家为站点审计的服务者:认证审计局(AUDITBUREAUOFVER
FICATIONSERVICES-ABVS),BPA国际和NIELSEN。
认证审计局(WWW.ACCESSABC.COM)成立于1996年1月1日,
它是发行量审计局(ABC)的下属机构。ABC有着80多年的发行量审计经验,成立AB
VS的目的是为新的和非传统媒介提供审计和认证服务。
BPA国际(WWW.BPAI.COM)自从1931年起就开始提供杂志审计服
务的全球领先者,他们建立交互审计分部的目的是因为“当网络广告已经成为一个有影响的
商业媒介的时候,广告主需要参照基于被独立的第三方机构认证的精确数字来购买网络空
间。”
NIELSEN,是电视收视率公司,和I/PRO合作提供网站审计和报告的分析
服务。当然,广告主发现I/PRO为网站测量流量的公司,提供自己站点的审计数字是有
问题的。
所有和测量有关的产品和服务都和审计局一起努力符合测量的标准。
一般审计的做法是事后审计组织随机地或者特定地把要参加流量审计的站点服务器中的某
一天日志文件拿走,以自己的专用软件进行分析,然后公布报告结果,以示这个站点的流量
的公正。而另外的网络应用的一个大项电子杂志的发行量的审计,目前在美国也逐渐展开,
I/PRO 已经为发行量较大的几个电子杂志做了发行量审计。电子杂志的发行量审计和传统行
业的报纸和杂志的发行量审计有着同样重要的意义和近似的操作方法,目前的操作可以为这
一电子杂志按每周、每月、每期统计发行量,总共的订户数,并且可以显出每周的发行量变
化以及用户的来源以及特征。它的操作方法也可以向前述的站点流量审计那样对邮件列表服
务器中的日志文件进行测量、公正,而为了更充分地证实日志文件的可信度,一般审计组织
会从电子杂志提交的用户和电子邮件地址中随机抽取一些用户进行验证。
不同的媒介收视率和测量提供者
媒介 测量和收视率服务 审计
电视 NIELSEN EMRC
电台 ARBITRON EMRC
杂志 MRI,SIMMONS ABC和 BPA
INTERNET 站点为中心 用户为中心 ABVS和 BPA国际
I/PRO MEDIAMETRIX
NETCOUNT, NETRATINGS
@PLAN
MARKETWAVE
INTERSE
RELEVANTKNOWLE
DGE
来源:MORGANSTANLEY技术调查公司和 THEZEFF集团
广告中收视率的角色:广告主如何比较受众
广告业中,电波媒介贩卖时间和空间给广告注意区分不同媒介的收听情况。每种媒介——印
刷媒介、电视、电台都有自己的方法来判断收阅情况(请看表格)。收视情况通过收视率,
也就是不同的人暴露于信息的数字。收视率等于在某一时刻、某一个群体收看某一媒介的比
率(例如,媒介的拥有电视的家庭数)。
就要我们在做电视购买时我们根本就离不开 ACNIELSEN或者索福瑞的收视率资料一样,我们
在做网络媒介的购买时同样也需要这种数据。目前,以用户为中心的网络测量的解决方案来
自于 MEDIAMETRIX™技术(以前称作 PC-METER)发明者 MEDIAMETRIX 公司,()它是较早的
提供站点的非重复受众曝光(到达率)、以家庭为中心的网络冲浪者的人口统计特征和网络
中所有站点的测量的调查服务公司。
不象以站点为中心的网络测量系统,MEDIAMETRIX™早期从代表美国拥有电脑的人口的 10,
000(现已扩到 4 万个)个家庭固定样本中获取信息,这些关于家庭成员访问了那些站点的
信息通过装在固定样本的家庭的电脑上的 MEDIAMETRIX™软件收集起来。
中国互联网信息中心(cnnic)的认证样本
因为站点卓越的测量能力,在未来,两种形式的网络测量——站点为中心的流量分析和受众
为中心的收视率分析——将可能变得很普通。
网络测量在很短的时间里走过了很长的路,并且随着网络卓越的测量能力的快速发展,持续
的改变将是经常的。人们都相信网络广告只有通过测量才能获取更多的信任。关于此部分的
细节说明请阅读第七章《网络调查》的有关部分。
背景报告
NIELSEN和 NETRATINGS合作推出网络媒体测量服务
著名的 NIELSEN 媒体评比公司与 NETRATINGS 网路媒体测量公司自 1998 年 10 月宣布策略联
盟后,首次推出一项名为 NIELSEN/NETRATINGS 的网路媒体测量服务,直接与 MEDIAMETRIX
网络媒体测量公司竞争这块市场。
NIELSEN/NETRATINGS提供客户网络广告追踪服务,这项服务能让广告主和网站获得包括阅听
众人口统计、广告曝光率、网站涵盖率、分析特定族群等资讯;甚至还可以分析竞争对手的
网络广告活动、什么公司的广告在哪些网站出现、锁定特定族群需花费多少等重要资讯。
STARCOMIP 互动行销媒体总监 BILLDENNEEN 认为,对于媒体企划人员来说,这是最重要的服
务。
NIELSEN 所使用的测量技术是,透过随机的方式以电话向全美国招募成员,这些成员都是在
家里上网络,现在已经有 9,000位成员,预计两个月后增加到 12,000人;再透过 JAVA-BASED
软体技术搜集即时的资料,每周公布最新调查结果。目前已经有几个著名的网站(如
AMAZON、 ALTAVISTA、 IVILLAGE 与 YAHOO!),以及广告代理商( BBDO、 BATESUSA、
COXINTERACTIVEMEDIA与 OGILVYONE等)使用他们这项服务。
和最大的对手 MEDIAMETRIX 做个简单对照,MEDIAMETRIX 的组织成员有 40,000 人,包括
5,000 个在工作场所上网络者,招募方式则以信函和电话随机邀请;MEDIAMETRIX 的软体功
能较强,除了可以得知网友上到哪个网站外,甚至某些 AOL或 POINTCAST的专属性服务也可
以追踪。
广告代理商和网站媒体都表示非常欢迎 NIELSEN 进入这个市场,虽然他们仍旧继续向
MEDIAMETRIX购买调查报告。YAHOO!的广告研究总监 BRUCEMACEVOY就说:“以短期来说,网
络测量仍未成熟,我们认为资料是越多越好;就长期的角度而言,我们需要的是资讯品
质。”而资讯品质正是 NIELSEN/NETRATINGS网站上所强调的重点。