由于blog各种垃圾评论太多,而且本人审核评论周期较长,所以懒得管理评论了,就把评论功能关闭,有问题可以直接qq骚扰我

2022年10月的内容

中间件

缓存一致性模式Cache Aside Pattern

缓存一致性模式Cache Aside Pattern
为什么不能直接更新缓存 首先要做一个小科普,在日常开发中,无论使用进程内缓存(如:ehcache),还是进程外的缓存中间件(如:redis),他的本质就是利用内存的高吞吐的特性高效的完成数据的提取工作。因为底层mysql 在进行数据提取操作的时候是随机读写,性能比较慢。我们通常把...

2年前 (2022-10-18) 5376℃ 0喜欢

数据库

SpringCache声明式缓存

SpringCache声明式缓存
介绍 自Spring 3.1版本以来,Spring框架支持低侵入的方式向已有Spring应用加入缓存特性。与声明式事务类似,声明式缓存Spring Cache抽象允许一致的API来已支持多种不同的缓存解决方案,同时将对代码的影响减少到最小。 准备工作 0、创建一个Spring b...

2年前 (2022-10-18) 6692℃ 1喜欢

JAVA

SpringBoot与Redis7交互

SpringBoot与Redis7交互
介绍 Spring Boot 内置了spring-boot-starter-data-redis这个模块用于简化Spring与Redis的 交互过程。 Spring-data-redis是spring大家族的一部分,提供了在spring应用中通过简单的配置访问 redis服务,对...

2年前 (2022-10-18) 2331℃ 0喜欢

大数据

canal基于binlog同步方案的局限性和思考

canal基于binlog同步方案的局限性和思考
Canal局限性 时效性问题 mysql 主从复制存在延迟,不适合对数据同步实时性要求高的场景 注:复制有延迟这个问题mysql自身都解决不了,更不要指望第三方工具解决,这也是为什么很多生产mysql不开启读写分离的原因 canal 高可用问题 canal 挂载主库:mysq...

2年前 (2022-10-18) 1263℃ 3喜欢

JAVA

Flume自定义拦截器解决数据漂移问题

Flume自定义拦截器解决数据漂移问题
场景介绍 在大数据业务采集场景中,经常会通过Flume把Kafka中的数据落地到HDFS进行持久保存和数据计算。为了数据计算和运维方便,通常会把每天的数据在HDFS通过天分区独立存储。 在数据落入HDFS 天分区目录的过程中,会出现数据跨天存储的问题,本来是2022年6月16日的...

2年前 (2022-10-18) 1539℃ 2喜欢

JAVA

flume 多路复用+自定义拦截器实践

flume 多路复用+自定义拦截器实践
Flume 内部原理 本文主要使用其中的Interceptor和Channel Selector Interceptor: 对source中的数据在进入channel之前进行拦截做一些处理,比如过滤掉一些数据,或者加上一些key/value等。flume内置了一些拦截器,也可以...

2年前 (2022-10-18) 1264℃ 1喜欢

大数据

HDFS 纠删码

HDFS 纠删码
纠删码介绍 HDFS默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。Hadoop3.x引入了纠删码,通过计算生成数据单元+计算单元的存储的方式,可以节省约50%左右的存储空间,这种存储方式同样也可以容忍集群中最多出现两台服务器同时宕机(注意:不同...

2年前 (2022-10-15) 668℃ 0喜欢

中间件

Kafka on Pulsar(KOP)

Kafka on Pulsar(KOP)
KOP 介绍 KoP(Kafka on Pulsar)通过在 Pulsar 代理上引入 Kafka 协议处理程序,为 Apache Pulsar 带来了原生的Apache Kafka协议支持。通过将 KoP 协议处理程序添加到您现有的 Pulsar 集群,您可以将现有的 Kafk...

2年前 (2022-10-14) 931℃ 1喜欢

中间件

Pulsar 架构原理

Pulsar 架构原理
bookkeeper 集群的架构 Apache BookKeeper 是企业级存储系统,旨在保证高持久性、一致性与低延迟。 企业级的实时存储平台需要具备的特点: 以极低的延迟(小于 5 毫秒)读写 entry 流 能够持久、一致、容错地存储数据 在写数据时,能够进行流式传输或...

2年前 (2022-10-14) 841℃ 0喜欢

中间件

Pulsar function

Pulsar function
function 背景 当我们进行流式处理的时候,很多情况下,我们的需求可能只是下面这些简单的操作:简单的ETL 操作\聚合计算操作等相关服务。 但为了实现这些功能,我们不得不去部署一整套 流处理服务(spark、flink等)。但是我们仅仅需要这些服务的一小部分功能,部署流处理...

2年前 (2022-10-14) 2982℃ 0喜欢