复杂度为 O(1) 的「最不常用」缓存算法的 Python 实现
admin
2023-07-30 22:59:42
0

这篇文章描述了怎么用 Python 实现复杂度为 O(1) 的「最不常用」(Least Frequently Used, LFU)缓存回收算法。在 Ketan Shah、Anirban Mitra 和 Dhruv Matani的论文中有算法描述。实现中的命名是按照论文中的命名。

LFU 缓存回收机制对于 HTTP 缓存网络代理是非常有用的,我们可以从缓存中移除那些最不常使用的条目。

本文旨在设计一个其所有操作的时间复杂度都只有 O(1)的 LFU 缓存算法,这些操作包括了插入、访问和删除(回收)。

这个算法中用了双向链表。其一是用于访问频率,链表中的每个结点都包含一个链表,其中的元素有相同的访问频率。假设缓存中有5个元素。有两个元素被访问了一次,三个元素被访问了两次。在这个例子中,访问频率列表有两个结点(频率为1和2)。第一个频率结点的链表中有两个结点,第二个频率结点的链表中有三个结点。

overview

我们要怎么构建它呢?我们需要的第一个对象是结点:

123456 class Node(object):    \”\”\”Node containing data, pointers to previous and next node.\”\”\”    def __init__(self, data):        self.data = data        self.prev = None        self.next = None

接下来是双向链表。每个结点有 prev 和 next 属性,分别等于前一个和下一个结点。head 被设为第一个结点,tail 被设为最后一个结点。

doubly_linked_list

我们可以为双向链表定义方法来在链表尾部加入结点,插入结点,删除结点以及获得链表所有结点的数据。

12345678910111213141516171819202122232425262728293031323334353637383940414243444546 class DoublyLinkedList(object):    def __init__(self):        self.head = None        self.tail = None        # Number of nodes in list.        self.count = 0     def add_node(self, cls, data):        \”\”\”Add node instance of class cls.\”\”\”        return self.insert_node(cls, data, self.tail, None)     def insert_node(self, cls, data, prev, next):        \”\”\”Insert node instance of class cls.\”\”\”        node = cls(data)        node.prev = prev        node.next = next        if prev:            prev.next = node        if next:            next.prev = node        if not self.head or next is self.head:            self.head = node        if not self.tail or prev is self.tail:            self.tail = node        self.count += 1        return node     def remove_node(self, node):        if node is self.tail:            self.tail = node.prev        else:            node.next.prev = node.prev        if node is self.head:            self.head = node.next        else:            node.prev.next = node.next        self.count -= 1     def get_nodes_data(self):        \”\”\”Return list nodes data as a list.\”\”\”        data = []        node = self.head        while node:            data.append(node.data)            node = node.next        return data

访问频率双向链表中的每个结点都是一个频率结点(下图中的Freq Node)。它是一个结点,同时也是一个包含有相同频率的元素(下图中Item node)的双向性链表。每个条目结点都有一个指向其频率结点父亲的指针。

freq_item_lists

return node

def insert_item_node(self, data, prev, next):
node = self.insert_node(ItemNode, data, prev, next)
node.parent = self
return node

def remove_item_node(self, node):
self.remove_node(node)

class ItemNode(Node):
def __init__(self, data):
Node.__init__(self, data)
self.parent = None

组。

这篇文章描述了怎么用 Python 实现复杂度为 O(1) 的「最不常用」(Least Frequently Used, LFU)缓存回收算法。在 Ketan Shah、Anirban Mitra 和 Dhruv Matani的论文中有算法描述。实现中的命名是按照论文中的命名。

LFU 缓存回收机制对于 HTTP 缓存网络代理是非常有用的,我们可以从缓存中移除那些最不常使用的条目。

本文旨在设计一个其所有操作的时间复杂度都只有 O(1)的 LFU 缓存算法,这些操作包括了插入、访问和删除(回收)。

这个算法中用了双向链表。其一是用于访问频率,链表中的每个结点都包含一个链表,其中的元素有相同的访问频率。假设缓存中有5个元素。有两个元素被访问了一次,三个元素被访问了两次。在这个例子中,访问频率列表有两个结点(频率为1和2)。第一个频率结点的链表中有两个结点,第二个频率结点的链表中有三个结点。

overview

我们要怎么构建它呢?我们需要的第一个对象是结点:

123456 class Node(object):    \”\”\”Node containing data, pointers to previous and next node.\”\”\”    def __init__(self, data):        self.data = data        self.prev = None        self.next = None

接下来是双向链表。每个结点有 prev 和 next 属性,分别等于前一个和下一个结点。head 被设为第一个结点,tail 被设为最后一个结点。

doubly_linked_list

我们可以为双向链表定义方法来在链表尾部加入结点,插入结点,删除结点以及获得链表所有结点的数据。

12345678910111213141516171819202122232425262728293031323334353637383940414243444546 class DoublyLinkedList(object):    def __init__(self):        self.head = None        self.tail = None        # Number of nodes in list.        self.count = 0     def add_node(self, cls, data):        \”\”\”Add node instance of class cls.\”\”\”        return self.insert_node(cls, data, self.tail, None)     def insert_node(self, cls, data, prev, next):        \”\”\”Insert node instance of class cls.\”\”\”        node = cls(data)        node.prev = prev        node.next = next        if prev:            prev.next = node        if next:            next.prev = node        if not self.head or next is self.head:            self.head = node        if not self.tail or prev is self.tail:            self.tail = node        self.count += 1        return node     def remove_node(self, node):        if node is self.tail:            self.tail = node.prev        else:            node.next.prev = node.prev        if node is self.head:            self.head = node.next        else:            node.prev.next = node.next        self.count -= 1     def get_nodes_data(self):        \”\”\”Return list nodes data as a list.\”\”\”        data = []        node = self.head        while node:            data.append(node.data)            node = node.next        return data

访问频率双向链表中的每个结点都是一个频率结点(下图中的Freq Node)。它是一个结点,同时也是一个包含有相同频率的元素(下图中Item node)的双向性链表。每个条目结点都有一个指向其频率结点父亲的指针。

freq_item_lists

相关内容

热门资讯

Mobi、epub格式电子书如... 在wps里全局设置里有一个文件关联,打开,勾选电子书文件选项就可以了。
定时清理删除C:\Progra... C:\Program Files (x86)下面很多scoped_dir开头的文件夹 写个批处理 定...
500 行 Python 代码... 语法分析器描述了一个句子的语法结构,用来帮助其他的应用进行推理。自然语言引入了很多意外的歧义,以我们...
scoped_dir32_70... 一台虚拟机C盘总是莫名奇妙的空间用完,导致很多软件没法再运行。经过仔细检查发现是C:\Program...
65536是2的几次方 计算2... 65536是2的16次方:65536=2⁶ 65536是256的2次方:65536=256 6553...
小程序支付时提示:appid和... [Q]小程序支付时提示:appid和mch_id不匹配 [A]小程序和微信支付没有进行关联,访问“小...
pycparser 是一个用... `pycparser` 是一个用 Python 编写的 C 语言解析器。它可以用来解析 C 代码并构...
微信小程序使用slider实现... 众所周知哈,微信小程序里面的音频播放是没有进度条的,但最近有个项目呢,客户要求音频要有进度条控制,所...
Apache Doris 2.... 亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于...
python清除字符串里非数字... 本文实例讲述了python清除字符串里非数字字符的方法。分享给大家供大家参考。具体如下: impor...