取消

热数据

在互联网中,很多业务对数据的访问并不是均匀的,而是呈现相对的数据访问倾斜(skewed workloads),会出现相对的hotspot,因此对冷热数据的研究还是很有必要的。按照数据被使用的频繁程度,数据可以被分为热数据、温数据和冷数据。热数据就是在一段时间内访问的较多的数据,它们在接下来的时间内访问的概率也会非常大。

冷热数据的判断大都基于两个标准:

(1)、访问的频繁度。 即在一段时间内对一个数据访问的越多,常理上我们越把它当成hot data。这个标准非常符合我们在之前的定义,也非常好理解。

(2)、访问的时效性。 即访问的数据越接近当前时间点,我们也可以从某种程度上把其当成hot data。因为大多数应用场景,都具有时间和空间的局部性(尤其是对于计算机领域来说),当前访问的数据,接下来访问的概率相对要较大些。

以上就是基本的判别标准,一些具体的应用算法也大都是根据上面的两个标准来划分冷热数据的。

 

点赞 3
联系我们
在线咨询 4008-868-127
售前咨询 189-2432-2993
市场合作 steven@shushangyun.com
广州市数商云网络科技有限公司
© 2013 - 2021 shushangyun.com
电话咨询 在线咨询 系统演示