Python以时间换空间的缓存替换算法例子代码

Python以时间换空间的缓存替换算法例子详细介绍，缓存是指能够进行高速数据交换的存储器，它先于内存与CPU交换数据，所以速度会非常的快。缓存就是将一些数据暂时存放于某一些地方，也许是内存，也有可能是硬盘。

在使用Scrapy爬网站时，产生出来的附加产物，由于在Scrapy爬取时，CPU运行时间紧迫度不高（访问频次太高容易被封禁），借此机会难得来上一下，让自己的内存解放一下。

算法原理：

通过把要缓存的数据用二进制展开，得到的二进制数据映射到缓存字段上，要检验是不是已经缓存过，仅需要去查找对应的映射位置就行了，要是全部匹配上，则已经缓存。

# 二进制就是个二叉树
# 如下面可以表示出来的数据有0, 1, 2, 3四个(两个树独立)

0 1
/ \ / \
0 1 0 1

所以对缓存的操作就转化为对二叉树的操作，添加和查找只要在二叉树上找到对应路径的node就行了。

算法关键代码：

def _read_bit(self, data, position):
return (data >> position) & 0x1
def _write_bit(self, data, position, value):
return data | value << position

实际使用效果怎么样?

在和Python默认的 set 相比较，得出测试结果如下（存取整型，不定长字符串，定长字符串）：

Please select test mode:4
Please enter test times:1000
===============================================================
TEST RESULT::
===============================================================
set() bytecache
items 1000 1000
add(s) 0.0 0.0209999084473
read(s) 0.0 0.0149998664856
hits 1000 1000
missed 0 0
size 32992 56
add(s/item) 0.0 2.09999084473e-05
read(s/item) 0.0 2.09999084473e-05
===============================================================
size (set / bytecache): 589.142857143
add time (bytecache / set): N/A
read time (bytecache / set): N/A
===============================================================
...test fixed length & int data end...
===============================================================
TEST RESULT::
===============================================================
set() bytecache
items 1000 1000
add(s) 0.00100016593933 6.1740000248
read(s) 0.0 7.21300005913
hits 999 999
missed 0 0
size 32992 56
add(s/item) 1.00016593933e-06 0.0061740000248
read(s/item) 0.0 0.0061740000248
===============================================================
size (set / bytecache): 589.142857143
add time (bytecache / set): 6172.97568534
read time (bytecache / set): N/A
===============================================================
...test mutative length & string data end...
===============================================================
TEST RESULT::
===============================================================
set() bytecache
items 1000 1000
add(s) 0.0 0.513999938965
read(s) 0.0 0.421000003815
hits 999 999
missed 0 0
size 32992 56
add(s/item) 0.0 0.000513999938965
read(s/item) 0.0 0.000513999938965
===============================================================
size (set / bytecache): 589.142857143
add time (bytecache / set): N/A
read time (bytecache / set): N/A
===============================================================
...test Fixed length(64) & string data end...

测试下来，内存消耗控制的非常好，一直在56字节，而是用 set 的内存尽管也不是很大，当相比于 ByteCache 来讲，则大上不少。

不过ByteCache 的方式来缓存，最大的问题是当碰到相当大的随机数据的时候，消耗时间可能会非常的惊人。比如下面这种随机长度的字符串缓存测试结果：

Please select test mode:2
Please enter test times:2000
===============================================================
TEST RESULT::
===============================================================
set() bytecache
items 2000 2000
add(s) 0.00400018692017 31.3759999275
read(s) 0.0 44.251999855
hits 1999 1999
missed 0 0
size 131296 56
add(s/item) 2.00009346008e-06 0.0156879999638
read(s/item) 0.0 0.0156879999638
===============================================================
size (set / bytecache): 2344.57142857
add time (bytecache / set): 7843.63344856
read time (bytecache / set): N/A
===============================================================
...test mutative length & string data end...

在2000个数据中，添加消耗31s，查找消耗44s，而 set 接近于0，单条数据也需要16ms（均值）才可以完成读/写操作。

可是正如开头所讲的，在紧迫度不是非常高的Scrapy中，这个时间并不会太过于窘迫，并且在Scrapy中，通常是用来缓存哈希后的数据，这一些数据的一个重要特性是定长，定长在本缓存算法中还是表现很不错的，在64位长度时，均值才0.5ms。而同时倒是可以在大量缓存的时候释放出非常客观的内存。

总结：

1. 这个方法的目标是用时间换取空间，切勿在时间紧迫度高的地方使用。

2. 十分适用大量定长，并且数据本身非常小的情况下使用。

3. 接2，不建议大家在大量不定长的数据，并且数据本身非常大的情况下使用。

上一篇：火影究极风暴4凯对六道班及须佐佐助对须佐班S评价技巧
下一篇：《银河文明3》DLC“佣兵”扩展包上市新增大量要素

Python以时间换空间的缓存替换算法例子代码

来源：本站整理发布时间：2016-2-19 14:34:47 人气:

大家还看了：

Python字典数据对象拆分的实现办法例子分享

python调用Delphi实现的Dll代码例子分享

python爬取w3shcool的JQuery课程并保存到本地例子代码

如何使用Python对SQLite数据库操作实例分析

如何使用python分析access日志例子思路分享

python实现可断点续传及并发的ftp程序代码分享

python如何查看系统网络流量信息例子分享

python字典键值添加及遍历方法实例分享

Python遍历字典时删除元素报异常问题怎么解决办法

python遍历truple list dictionary的几种实现方法分享

Python以时间换空间的缓存替换算法例子代码

来源：本站整理 发布时间：2016-2-19 14:34:47 人气:

大家还看了：

来源：本站整理发布时间：2016-2-19 14:34:47 人气: