5种常用缓存策略的优劣盘点与组合解析

朱小厮 2020-04-06 10:49:00

今天翻译一篇关于缓存策略的文章，原文标题是《Cacheing Strategies and How to Choose the Right One》，同事推荐看的，觉得总结的不错，鉴于很多同学都懒得看英文的，所以用蹩脚的水平试着翻译一波。

缓存是提高系统性能的最简单方法之一。相对而言，数据库（or NoSQL数据库）的速度比较慢，而速度却往往又是制胜的关键。

如果使用得当，缓存可以减少相应时间、减少数据库负载以及节省成本。本文罗列了几种缓存策略，选择正确的一种会有很大的不同。缓存策略取决于数据和数据访问模式。换句话说，数据是如何写和读的。例如:

系统是写多读少的吗？(例如基于时间的日志)；
数据是否是只写入一次并被读取多次?(例如用户配置文件)；
返回的数据总是惟一的吗?(例如搜索查询)。

选择正确的缓存策略是提高性能的关键。让我们快速了解一下各种缓存策略。

第一种：Cache-Aside

这可能是最常用的缓存方法。缓存位于一边，应用程序直接与缓存和数据库对话。

简要解释一下:

应用程序首先检查缓存；
如果在缓存中找到，表示已经命中缓存。数据被读取并返回给应用程序；
如果在缓存中没有找到，则未命中缓存。应用程序必须做一些额外的工作，它需要查询数据库来读取数据，将数据返回给客户端，然后还要将数据存储在缓存中，这样对相同数据的后续读取可以命中缓存。

Cache-aside策略特别适合读多的应用场景。使用Cache-aside的系统对缓存失效具有一定的弹性。如果缓存集群宕机，系统仍然可以通过直接访问数据库进行操作。(不过，如果缓存在峰值负载期间下降，这也没有多大帮助。响应时间可能会变得很糟糕，最糟糕的情况是，数据库可能会停止工作。)

另一个优点在于缓存中的数据模型可以与数据库中的数据模型不同。例如，多个查询产生的响应可以存储在某个请求id上。

当使用cache-aside时，最常见的写策略是直接将数据写到数据库中。当这种情况发生时，缓存可能与数据库不一致。为了解决这个问题，开发人员通常会引入TTL，并继续提供陈旧的数据，直到TTL过期。如果必须保证数据的新鲜度，开发人员要么使缓存条目无效，要么使用适当的写策略，我们将在后面讨论。

第二种：Read-Though Cache

Read-though策略下的缓存与数据库保持一致。当缓存丢失时，它从数据库加载相应的数据，填充缓存并将其返回给应用程序（参考下图）。

cache-aside和read-through策略都是延迟加载数据的，也就是说，只在第一次读取数据时才加载数据。

虽然read-through和cache-aside非常相似，但至少有两个关键区别:

在cache-aside中，应用程序负责从数据库中获取数据并填充缓存。在read-through中，此逻辑通常由库或独立缓存提供程序支持；
与cache-aside不同，read-through cache中的数据模型不能与数据库中的数据模型不同。

当多次请求相同的数据时，read-through缓存最适合于读量较大的工作负载。例如，一个新闻故事。缺点是，当第一次请求数据时，它总是导致缓存丢失，并导致额外的数据加载到缓存的代价。

开发人员通过手动发出查询来“预热”或“预热”缓存来处理这个问题。就像cache-aside一样，数据也可能在缓存和数据库之间变得不一致，而解决方案就在写策略中，我们将在接下来看到这一点。

第三种：Write-Through Cache

在这种写策略中，首先将数据写入缓存，然后写入数据库。缓存与数据库保持一致，写操作总是通过缓存到达主数据库。

就其本身而言，write-through缓存似乎没有多大作用，实际上，它们引入了额外的写延迟，因为数据先写到缓存，然后写到主数据库。但是，当与read-through结合使用时，我们获得了read-through的所有好处，还获得了数据一致性保证，使我们不必使用缓存失效技术。

DynamoDB Accelerator (DAX)是write-through / read-through cache的一个很好的例子。它与DynamoDB和应用程序内联。对DynamoDB的读写可以通过DAX完成。(附注：如果您计划使用DAX，请确保熟悉它的数据一致性模型以及它如何与DynamoDB交互。)

第四种 Write-Around

这种策略下，数据直接写入数据库，只有读取的数据才能进入缓存。Write-around可以与read-through结合使用，并在数据只写一次、读取次数较少或从不读的情况下提供良好的性能。例如，实时日志或聊天室消息。同样，这个模式也可以与cache-aside组合使用。

第五种 Write-Back

这种策略下，应用程序将数据写入缓存，缓存会立即确认，并在延迟一段时间后将数据写入数据库。有时这种策略也被称为write-behind。

Write-back缓存提高了写性能，对于写工作量大的工作负载非常有用。当与read-through相结合的时候，它对于混合工作负载非常有效，最近更新和访问的数据总是在缓存中可用。它对数据库故障具有很大程度上的弹性，可以容忍一些数据库的宕机。如果支持批处理或合并，则可以减少对数据库的总体写操作，这将减少负载并降低成本。

一些开发人员使用Redis时，同时采用了cache-aside和write-back两种策略，以便更好地吸收峰值负载期间的峰值。主要缺点是，如果缓存失效，数据可能会永久丢失。大多数关系数据库存储引擎(例如InnoDB)的内部都默认启用了回写缓存。查询首先写入内存，最后刷新到磁盘。

总结

在本文中，我们探讨了不同的缓存策略及其优缺点。在实践中，请仔细评估您的目标，理解数据访问(读/写)模式，并选择最佳策略或组合策略。

如果你选错了怎么办？一个与你的目标或访问模式不匹配的？您可能会引入额外的延迟，或者至少没有看到全部的好处。例如，如果在实际应该使用write-around/read-through时选择write-through/read-through(访问写入数据的频率较低)，那么缓存中就会有无用的垃圾。

可以说，如果缓存足够大，它可能没问题。但在许多实际的高吞吐量系统中，当内存永远不够大并且需要考虑服务器成本时，正确的策略很重要。

>>>>

原文链接

https://codeahoy.com/2017/08/11/caching-strategies-and-how-to-choose-the-right-one/

作者丨朱小厮

来源丨朱小厮的博客（ID：hiddenkafka）

dbaplus社群欢迎广大技术人员投稿，投稿邮箱：editor@dbaplus.cn

从过去40年至今，数据库的形态基本经历了传统商业数据库、开源数据库到云原生数据库的演进过程。云时代下数据库将如何革新与创变？金融行业核心数据库迁移与建设如何安全平稳展开？来2020 DAMS中国数据智能管理峰会寻找答案：

《开源数据库MySQL在民生银行的应用实践》民生银行项目经理徐春阳

从2015年至今，MySQL已经被应用在民生银行各种重要级别的业务系统中，本次分享将介绍民生银行在全面推广MySQL过程中的实践经验，8月7日邀你一起在上海探讨开源数据库在金融行业的更多可能性。

最新评论

: 访客 2024年04月08日

如果字段的最大可能长度超过255字节，那么长度值可能…

: 访客 2024年03月04日

只能说作者太用心了，优秀

: 访客 2024年02月23日

感谢详解

: 访客 2024年02月20日

一般干个7-8年（即30岁左右），能做到年入40w-50w；有…

: 访客 2023年08月20日

230721

活动预告

即将开始

2026年XCOPS智能运维管理人年会-广州站报名开始啦

时间：2026-05-22形式：线下活动
已结束

直播预告丨AI驱动智能运维：从被动排障到主动风险防御

时间：2026-05-08形式：线上分享
已结束

别再去「龙虾会」了！这是只给 Agent Builder 的北上杭闭门局 | 2026 春季首发

时间：2026-04-24形式：线下活动
已结束

4月18日，与资深架构师共话AI研发变革，更有压轴技术辩论「开源vs闭源」如何选择？

时间：2026-04-18形式：线下活动
已结束

直播预告丨基于Kibana的数据可视化平台建设实践

时间：2026-03-25形式：线上活动
已结束

3 月 7 日深圳｜Data for AI Meetup：5 位开源专家聊 AI 数据基础设施实战

时间：2026-03-07形式：线下活动
已结束

OceanBase 社区年度社区嘉年华解锁！AI Coding、社区开放麦、开源集市、社区圆桌……1月31日等你共聚！

时间：2026-01-31形式：线下活动
已结束

1 月 24 日北京｜Data for AI Meetup：Agent 时代的数据基础设施正在如何重构？

时间：2026-01-24形式：线上活动
已结束

直播预告丨AIOps如何从Demo走向规模化落地

时间：2026-01-28形式：线上活动
已结束

AI新质生产力研讨会

时间：2026-01-24形式：线下活动
已结束

直播预告丨携程全链路压测体系建设：节日洪峰场景下的落地实践

时间：2026-01-14形式：线上活动
已结束

直播预告丨大模型在数据安全领域的应用探索

时间：2026-01-07形式：线上活动
已结束

北京开发者集结！12月21日，共话大模型推理与开源生态

时间：2025-12-21形式：线下活动
已结束

Data for AI Meetup @上海 12/20（周六）聚焦AI多模态湖仓

时间：2025-12-20形式：线下活动
已结束

ITCP联盟第五届技术大会【AI应用专场】报名火热开启！

时间：2025-12-13形式：线下活动
查看更多

5种常用缓存策略的优劣盘点与组合解析

降本的Kubernetes何时成了“成本刺客”？

YouTube如何利用MySQL支撑24.9亿用户？

人肉运维100次后，年底出了P0级故障……

关于国产数据库我不得不说

分库分表，可能真的要退出历史舞台了！