由于blog各种垃圾评论太多,而且本人审核评论周期较长,所以懒得管理评论了,就把评论功能关闭,有问题可以直接qq骚扰我

 分类:大数据

impala 实时分析引擎介绍

impala 实时分析引擎介绍
impala的产生背景和应用场景 Impala由cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在HDFS、Kudu、HBase(实际生产环境中不用)...

24小时前 20℃ 0喜欢

实时计算——storm原理和运维

实时计算——storm原理和运维
什么是storm Apache Storm是一个分布式实时大数据处理系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架,具有较高的吞吐率和较低的延迟。Storm是无状态的,它通过Apache ZooKeeper 管理分布式环境和集群状态。部署和开发S...

4个月前 (05-04) 710℃ 0喜欢

CDH 20个实战案例

CDH 20个实战案例
CCA介绍 Cloudera Certified Associate(CCA认证)是Cloudera面向初中级 Hadoop技术人员推出的认证考试。由于Cloudera的Hadoop发行版是目前 使用最广泛的版本,Cloudera的认证也因此被广泛承认。能够获得这类 证书对于技术...

6个月前 (02-26) 1584℃ 0喜欢

hadoop集群认证和授权

hadoop集群认证和授权
CDH 安全 hadoop的HDFS和mapreduce均缺乏相应的安全机制,比如在HDFS中,用户只要知道某个block的blockID,便可以绕过NameNode直接从DataNode上读取该block,用户可以向任意DataNode上写block;在MapReduce中,用...

7个月前 (02-04) 1651℃ 0喜欢

CDH和CM介绍及搭建

CDH和CM介绍及搭建
CDH和CM简介 什么是CDH CDH(Cloudera’s Distribution Including Apache Hadoop)是Hadoop发行版的一种,是一套目前比较完整的、充分测试的Hadoop及其相关项目的发行版。CDH的基础组件均基于apache license...

7个月前 (02-04) 1353℃ 0喜欢