由于blog各种垃圾评论太多,而且本人审核评论周期较长,所以懒得管理评论了,就把评论功能关闭,有问题可以直接qq骚扰我
大数据

CDH hive 2.1.1 升级hive2.3.8

CDH hive 2.1.1 升级hive2.3.8
简介 因为CDH5和6架构使用组件间紧耦合架构,不提供组件的独立升级,如果在使用CDH过程中,有需要独立升级组件的需求,就需要尝试和Apache的社区版本进行结合部署,本文以独立升级hive为例进行展示。 环境说明 操作系统:centos 7.8 CDH 版本6.3.2 hive...

2天前 15℃ 1喜欢

大数据

atlas2.1集成CDH6.2进行元数据管理

atlas2.1集成CDH6.2进行元数据管理
Atlas介绍 Apache atlas为组织提供开放式元数据管理和治理功能,用以构建其数据资产目录,对这些资产进行分类和管理,并为数据分析师和数据治理团队,提供围绕这些数据资产的协作功能。 核心组件 core Ingest/Export:Ingest 组件允许将元数据添加到 ...

4个月前 (02-22) 570℃ 37喜欢

大数据

ClickHouse学习和集群部署

ClickHouse学习和集群部署
1、ClickHouse产生背景 随着科技的发展,时代的进步,数据分析师已经不再满足于传统的T+1式报表或需要提前设置好维度与指标的OLAP查询。数据分析师更希望使用可以支持任意指标、任意维度并秒级给出反馈的大数据Ad-hoc查询系统。这对大数据技术来说是一项非常大的挑战,传统的...

4个月前 (02-09) 1315℃ 5喜欢

架构设计

灰度发布系统架构设计

灰度发布系统架构设计
灰度发布的定义 互联网产品需要快速迭代开发上线,又要保证质量,保证刚上线的系统,一旦出现问题可以很快控制影响面,就需要设计一套灰度发布系统。 灰度发布系统的作用,可以根据配置,将用户的流量导到新上线的系统上,来快速验证新的功能,而一旦出现问题,也可以马上的修复,简单的说,就是一套...

6个月前 (12-20) 867℃ 13喜欢

自动化

k8s 弹性伸缩,基于prometheus自定义指标

k8s 弹性伸缩,基于prometheus自定义指标
简介 上一批文章写了,基于CPU指标的弹性伸缩,资源指标只包含CPU、内存,一般来说也够了。但如果想根据自定义指标:如请求qps/5xx错误数来实现HPA,就需要使用自定义指标了,目前比较成熟的实现是 Prometheus Custom Metrics。自定义指标由Prometh...

7个月前 (11-24) 1443℃ 0喜欢

自动化

k8s 弹性伸缩,基于CPU指标

k8s 弹性伸缩,基于CPU指标
k8s弹性伸缩涉及内容 在 Kubernetes 的生态中,在多个维度、多个层次提供了不同的组件来满足不同的伸缩场景。 有三种弹性伸缩 CA(Cluster Autoscaler):Node级别自动扩/缩容cluster-autoscaler组件 HPA(Horizontal ...

7个月前 (11-22) 1325℃ 0喜欢

大数据

Azkaban 任务运行时长监控

Azkaban 任务运行时长监控
1、解决的痛点 各种原因导致的Azkaban任务运行假死,无法正常跑任务的情况。 2、解决方案 通过调用Azkaban API接口,获取project flow的startTime时间,通过程序进行相减,得出的值超过报警阀值进行报警。 API调用示例: 1、获取用户身份的sess...

11个月前 (07-19) 1600℃ 25喜欢

未分类

互联网高并发架构设计手段

互联网高并发架构设计手段
前言 互联网架构设计有三高分别是,高可用,高扩展,高并发,本文主要以高并发设计为主来和大家分享互联网架构中的常用高并发手段。 高并发的考核指标 对于高并发的衡量有两个重要的指标: 吞吐量:表示架构每秒能抗多少并发 响应延迟:表示每个请求多久可以得到响应        系统性能优化...

11个月前 (07-12) 1186℃ 4喜欢

数据库

ES集群数据冷热分离实现

ES集群数据冷热分离实现
冷热数据分离的目的 1、ES集群异构,机器硬件资源配置不一,有高性能CPU和SSD存储集群,也有大容量的机械磁盘集群,比如我们的场景就是存放冷数据的集群,服务器都是多年前买的一批满配的4T Dell R70,但是新扩容的热节点机器均为DELL 高性能SSD磁盘和CPU的R740机...

12个月前 (06-27) 2716℃ 6喜欢

大数据

impala 实时分析引擎介绍

impala 实时分析引擎介绍
impala的产生背景和应用场景 Impala由cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在HDFS、Kudu、HBase(实际生产环境中不用)...

2年前 (2019-08-20) 4230℃ 23喜欢