sqoop 是基于 hdfs 的一款 ETL 工具,主要作用是进行 hive(hdfs) 和关系型数据库之间的数据传输。 jdk 、 hadoop 和 hive 在之前的文章 Hadoop安装指南 、 Hive安装指南 详细介绍过安装方法。sqoop 分 sqoop1 和 sqoop2 两个版本并行发展,因为 sqoop2 目前还有许多问题,所以选择 sqoop1 来安装,现在介绍安装 sq...
Kylin安装指南
安装环境 ubuntu-20.04.3 LTS jdk-1.8.0_321 hadoop-2.10.1 apache-hive-2.3.9 hbase-1.6.0 apache-kylin-3.1.0 安装 kylin 在 Kylin 官网 下载所需要版本的 ky...
Zookeeper安装指南
安装环境 ubuntu-20.04.3 LTS jdk-1.8.0_321 apache-zookeeper-3.6.3 安装 zookeeper 在 Zookeeper 官网 下载所需要版本的 zookeeper 安装包,解压到 /usr/local 文件夹中,并在 ~/.bashrc 中设置环境变量。 # set z...
Hbase安装指南
Hbase 是一个开源的、分布式的、版本化的非关系型数据库,它利用 HDFS 来提供分布式数据存储。这里安装 hbase 主要是用来之后安装 kylin。jdk 和 haodop 在之前的文章 Hadoop安装指南 详细介绍过安装方法,这里就不赘述了。现在介绍安装 hbase ,采用伪分布模式安装以用来学习。 安装环境 ubuntu-20.04.3 LTS ...
oozie安装指南
安装环境 ubuntu-18.04 jdk-1.8.0_261 hadoop-2.10.0 maven-3.6.3 hbase-1.6.0 sqoop-2.6.0 下载 oozie 在 oozie 官网 下载所需要版本的 oozie 源码包,解压到 /usr/lo...
软件安装合集
Zookeeper Hadoop Hive hiveserver2 Sqoop Hbase Spark Flink Kylin kafka oozie
Spark安装指南
jdk 和 haodop 在之前的文章 Hadoop安装指南 详细介绍过安装方法,这里就不赘述了。本文记录 scala 以及 spark 的安装,采用 standalone 模式。 安装环境 ubuntu-20.04.3 LTS jdk-1.8.0_321 scala-2.12.15 hadoop-2.10.1 ...
Sqoop安装指南
sqoop 是基于 hdfs 的一款 ETL 工具,主要作用是进行 hive(hdfs) 和关系型数据库之间的数据传输。 jdk 、 hadoop 和 hive 在之前的文章 Hadoop安装指南 、 Hive安装指南 详细介绍过安装方法。sqoop 分 sqoop1 和 sqoop2 两个版本并行发展,因为 sqoop2 目前还有许多问题,所以选择 sqoop1 来安装,现在介绍安装 sq...
hadoop生态圈
phoenix Apache Phoenix OLAP and operational analytics for Apache Hadoop.
Flink安装指南
jdk 、 scala 和 haodop 在之前的文章 Hadoop安装指南 、 Spark安装指南 详细介绍过安装方法。现在介绍安装 flink ,同样是在单个节点上安装用来学习。 安装环境 ubuntu-20.04.3 LTS jdk-1.8.0_321 scala-2.12.15 hadoop-2.10.1...