本文源码:GitHub·点这里 || GitEE·点这里 一、Kafka集群环境 1、环境版本 版本:kafka2.11,zookeeper3.4 注意:这里zookeeper3.4也是基于集群模式部署。 2、解压重命名...
阅读(143) 评论(0)
本文源码:GitHub·点这里 || GitEE·点这里 一、索引简介 1、基本概念 首先要明确索引是什么:索引是一种数据结构,数据结构是计算机存储、组织数据的方式,是指相互之间存在一种或多种特定关系的数据元素的集合,例如:...
阅读(74) 评论(0)
本文源码:GitHub·点这里 || GitEE·点这里 一、数据可视化 1、基础概念 数据可视化,是关于数据视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽取出来的信息,包括相应信息单...
阅读(57) 评论(0)
本文源码:GitHub·点这里 || GitEE·点这里 一、列式库简介 ClickHouse是俄罗斯的Yandex公司于2016年开源的列式存储数据库(DBMS),主要用于OLAP在线分析处理查询,能够使用SQL查询实时生...
阅读(84) 评论(0)
本文源码:GitHub·点这里 || GitEE·点这里 一、DataX工具简介 1、设计理念 DataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、...
阅读(66) 评论(0)