由于这些数据存于数据库中,而且日期是恒定的,以是对这些数据举行跨地域处置或相关性剖析就很直接了。
例如,由于节假日时代,新的数码相机经常被作为礼物赠予,以是,与平时比起来,节假日时代的平均照片上载量有很大增进,就不奇怪了。有了这些数据,我们可以针对相同日期计算出其他值来,以是,我们能够毫无难题地考察平均上载巨细是若何增添磁盘空间消耗的(由于照片的原始尺寸变大了),从而响应地增添Flickr Pro账号的订购量(与免费账号相比,Pro账号没有容量限制)。
有了这些高层数据之后,你的机构中面向产物的那些人对这些数据也抱有极大的兴趣,你一点都不用感应惊讶。虽然你可能是用磁盘空间消耗数据为存储需求做容量计划,但他们却尚有看法,好比,这些使用情形的数据可以辅助他们做功效公布的时间表。网站使用情形有助于制订产物路线图,产物路线图有助于容量计划,容量计划有助于预算以及基础架构的前途,等等。你很庆幸是以一种简朴且可移植的花样存储这些数据的,由于机构中的任何人都可能用到这些数据。
对于应用层面的数据,最有用的是能够跟踪用户的交互情形。好比一个社会网络站点,用户可以与其他用户成为为ldquo;密友rdquo;、上载照片,或在其他用户页面上揭晓谈论。纪录这些事宜是不能用正规的时间距离的方式的,这与采集CPU丈量数据差别,采集CPU数据用的是正规的时间距离方式一好比说,每隔15秒举行采样。这种方式与前述将天天发生的事宜举行累加的方式也差别。将这些非周期性事宜与周期性事宜举行相关性剖析时,要确保时间尺度是牢固的。
Flickr的这种非正规类型的一个例子如下:我们公布了一个功效,让你导入种种邮件地址簿,并将这些地址簿中的名字及邮箱与你还不是联系人的网站成员举行关联,然后批量添加联系人。若是我们只是将天天产生了若干联系人举行累加的话,我们在图上就会看到谁人数据点上有个跳变,但这个功效公布后,并没有看到跳变,在随后的数小时一直到下周,也都没有看到。同样的情形另有用户对照片举行标注(tagging)的功效。领会这些信息有助于我们未来若何公布网站建设新功效,那就是一在公布功效之前,我们应该准备数据采集(对这些情形而言,就是一张MYSQL的汇总表)。p分页题目e
(责任编辑:网络)

评论列表