文献标识码: A
文章编号: 0258-7998(2013)04-0124-02
在信息社会中,为各类用户提供海量信息网站的建设飞速发展,其中包含的信息随之成倍增长,在为用户带来便利的同时,能否以较短的时间尽可能多地获取用户需要的信息,成为评价一个网站的重要标准。综观现有网站的评价标准,主观因素主导着标准,客观的量化标准也仍是以主观评价为前提,有的仅仅计算了主观因素的权重。本文在考虑用户体验的情况下,综合以往网站评价的相关研究,基于用户分组,提出了一种新的网站评价的量化标准。
1 用户浏览网站的数学模型
1.1 用户浏览网站的马氏链排队模型
用户浏览网页内容是网站对于用户的一次服务,每一个网页即是一个服务窗,用户搜寻下一个点击目标即是等待服务的过程。由此,用户浏览网站即可用一个排队模型来表述[1]。假定网站共有n个网页,则用户对网页浏览的抽象排队模型的状态流图如图1所示。
其中,k表示用户从进入网站开始浏览了k个网页,0≤k≤n;0表示正在浏览第一个网页或者离开系统。由k到0 的状态表示用户浏览k个网页后离开系统。
其中,n为网站的网页总数。此式求出用户组在网站中停留的时间,这个时间参量对于衡量该用户组浏览网站的效率具有重要的参考价值。
2 基于用户分组的网站评价量化标准
根据1.2节的计算得到某一用户组在网站中停留的时间,包括阅读时间和搜索时间。阅读时间由用户阅读速度和网页内容决定。在用户阅读速度一定的情况下,用户是否对网页内容感兴趣是阅读时间的决定因素;搜索时间则由网站的导航结构及信息推送决定。因此用户浏览网站的时间可以作为网页内容是否具有可读性、网站结构是否合理、信息推送是否准确及时,以及运行机制是否高效的标准之一。从信息量的角度来看,一个网站的信息熵越多,表明网站包含的信息量越大,则用户感兴趣的内容也就越多。由此可以得出结论:一个网站的质量一方面体现于用户浏览的时间,另一方面体现于网站自身的信息熵。对于一定的网站,其信息熵设为H(W)[3];第j个用户组的停留时间为tj。根据本文分析及实际经验,提出效率熵公式:
效率熵ES是计算网站服务效率量化评价的标准,表明了网站的评价与网站信息量和浏览时间的关系。利用量化的标准来对网站进行评价,更具客观性和公平性。
3 实例分析
以昆明理工大学英文版主页为例,网址http://www.kmust.edu.cn/en/index.htm,该网站的用户分为教工组,学生组及游客组,由式(6)分别得到λ、μ与ES的关系。图3所示为μ在一定的情况下,λ与ES成正比关系。图4在λ固定的情况下,μ与ES也成正比趋势;图5所示为ES与λ、μ的三维关系图像,说明了λ、μ与ES的正比关系。综合λ、μ的物理意义和以上函数图像,可以得到:网站信息推送的命中率越高,则导航结构越合理,ES值越大;用户的阅读能力越强,ES值越大。这一实验结果与实际情况相符。
本文根据排队论相关理论对用户浏览网站进行数学建模,求得用户组停留网站的平均时间。结合网站的信息熵提出新的网站评价标准——效率熵ES,给出了ES的推导过程,并对此公式进行了实例验证。实验结果表明,本公式能够避免网站评价中的部分主观因素,针对不同用户组对网站进行评价,减少了评价中不公平性。同时数字化的标准增加了评价的客观性和准确性。
参考文献
[1] 陆穿赉. 排队论(第2版)[M]. 北京:北京邮电大学出版社,2009.
[2] LIU C, WHITE R, DUMAIS S. Understanding web browsing behaviors through Weibull analysis of dwell time[C].SIGlR’10:Proceeding of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM,2010:379-386.
[3] 姜丹.信息论与编码(第3版)[M].合肥:中国科学技术大学出版社,2009.