算法积累：LRU 算法

算法：LRU 算法

1. 什么是 LRU

LRU：Least Recently Used-最近最少使用算法，是一种内存数据淘汰策略。常用作当内存不足时，需要淘汰清理掉最近最少使用的数据。LRU 常用于缓存系统的淘汰策略。

2. LRU 的应用场景

在缓存系统中，一旦缓存的数据量过大，就会对应用节点内存的消耗就非常严重，而且对缓存数据的检索也会变得越来困难。那么就会存在以下问题：

内存消耗变大
检索效率变低

对于内存消耗变大，我们可以通过限制缓存的大小来缓解大量的缓存数据对内存造成的压力；对于数据检索效率的问题，我们可以将热点数据放在最前面，将长时间未使用或使用频率很小的数据放在缓存的最后面，即：对数据进行热度排序。

不论是内存的消耗还是检索的效率的问题均可以通过 LRU 来解决。

3. 手写实现 LRU

3-1. 使用链表结构实现 LRU


package com.kyrie.utils.dataStructure;

import java.util.LinkedList;
/***
 * @project: interface-common
 * @package: com.kyrie.utils.dataStructure
 * @description: 使用链表实现LRU算法
 * @author: kyrie
 * @mail: 18654169290@163.com
 * @createDate: 2021-04-04 13:51
 */
public class LRUByLinkedList {
    // 限制缓存大小，解决内存消耗大的问题
    private static final int MAX_CACHE_SIZE = 10;
    // 使用链表结构存储缓存
    private static final LinkedList<LRUCacheData> cacheData = new LinkedList<>();
    /**
     * 应用获取缓存使用
     * @param id 缓存ID
     */
    public LRUCacheData get(String id) {
        if (null == id || "".equals(id))
            throw new NullPointerException("CacheId is not be Null");
        LRUCacheData data = null;
        synchronized (cacheData) {
            // 遍历链表，查找缓存数据
            for (LRUCacheData item : cacheData) {
                if (id.equals(item.getCacheId())) {
                    data = item;
                    // 在链表中移除该缓存数据，再将其添加到表头位置
                    cacheData.remove(item);
                    cacheData.addFirst(data);
                    return data;
                }
            }
        }
        if (null == data)
            data = getDataFromDB(id);
        return data;
    }

    /**
     * 缓存不存在时，从DB获取数据并设置缓存头位置
     * @param id 数据ID
     */
    private LRUCacheData getDataFromDB(String id) {
        // get data from DB code here
        LRUCacheData data = new LRUCacheData();
        // put data in cache
        push(data);
        return data;
    }

    /**
     * 将缓存放在链表头节点，并判断缓存大小是否达到最大值，达到则清理尾节点数据
     * @param lruCacheData 缓存数据
     */
    private void push(LRUCacheData lruCacheData) {
        synchronized (cacheData) {
            if (cacheData.size() == MAX_CACHE_SIZE) {
                cacheData.removeLast();
            }
            cacheData.addFirst(lruCacheData);
        }
    }
}

上面已经通过 LinkedList 链表实现了简单的 LRU 算法，通过限制链表的长度来限制缓存的大小；通过将热点数据移动到链表表头实现热点数据的快速检索，自动清理链表尾部的数据。但仍存在这一些问题：

命中率问题：每次访问数据都需要从链表头开始遍历，这对于热点数据的访问效果很好（热点数据都聚集在链表头部附近，很快就能遍历到结果），可一旦数据分散较为均匀时，访问命中率急剧下降
性能损耗问题：每次命中数据后，都需要将数据重新移动至链表头部，存在相当大的性能损耗；
缓存污染问题：并非所有数据有必要缓存（可能整个应用运行过程中某些数据被访问的次数很少），但是算法实现过程没办法对热点数据（频繁访问的数据，这才是有价值进行缓存的）进行区分，使得缓存队列贬值

算法概述

用计算机求解问题的步骤：分析问题建立数学模型算法设计与选择算法表示算法分析算法实现算法三要素：操作控制结构数据结构算法的性质：有穷性：算法必须在执行有限步骤后终止，不能无限循环，每一步骤也需在有限时间内完成确定性：算法的每条指令必须有明确的含义，无二义性，相同的输入必须产生相同的执行路径和结果 ..

Mother Cup

C 题：音频文件的高质量读写与去噪优化关键词：保证音频质量进行高效存储和传输不同音频文件不同编码算法：WAV、MP3、FLAC 采样率、比特深度、压缩算法污染：空调声、电脑风扇、室外交通、设备电流（针对性的去噪算法）问题 1： [图片] 多元线性回归(多输入 Y=AX+BY+CZ) 因素量化：文件大小(S) ..

论文分享

FineFilter- A Fine-grained Noise Filtering Mechanism for Retrieval-Augmented Large Language Models 任务目标是：通过噪声检测与过滤来提升模型在复杂问题中的推理能力。收集充分有效的推理线索，过滤其余无关信息（噪声也即模型判 ..

ddpm (新)

太多博客或者学习资料喜欢一上来就从 ELBO 等角度去推导 loss ，但是对于掌握一个模型，如果我们连模型在做什么都没有一个宏观的把握，只是一味的陷入类似于收敛性证明的漩涡，这么做我认为是丢掉了重点。之所以大家喜欢这么做的原因，主要是原论文的出发点就是从 ELBO 角度去把东西一步步推出来的。我认为这样无可非议，因为 ..

CCM: Real-Time Controllable Visual Content Creation Using Text-to-Image Consistency Models

0 Abstract Consistency Models 优点就是推理速度快，去噪只需几步即可。 control-conditioned image generative model 一般是通过在朴素 ddpm 上增加 ControlNet 训练得到。图像质量不错，与 control 信息的吻合程度也不错，唯独就是时 ..

consistency model

paper: Consistency Models 看这一篇笔记之前，最好先把 'score-based SDE' 这篇笔记看了。score-based SDE 这篇笔记就是说，现有的生成模型，都可以用 SDE 去描述它们的前向和反向过程。而且发现，反向过程还可以用确定性的 ODE 过程来描述。这篇 paper 受到 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于