目录

kudu + impala 测试环境搭建及测试

目录

1. 配置 kudu

1.1. 配置执行环境

直接使用官网 quickstart 的部署方法,使用docker安装。

docker 安装方法可见另一个帖子 使用 docker-machine 安装docker

我使用的是win10 自带的 hyper-v 虚拟机 docker 创建方法

使用的创建语句如下:

docker-machine create -d hyperv --hyperv-cpu-count 4 --hyperv-memory 8192 --hyperv-virtual-switch "P Default Switch" docker-default
这里我设置了,4核8G,其他参数可执行 docker-machine create -d hyperv --help 查看。如果使用的是virtualbox,替换 hyperv 即可
执行 create 一定要用git带的那个 bash,可以搜索bash,再右键用管理员运行。如果用windows自带的 powershell,会一直卡在 Waiting for SSH to be available…​

1.2. 测试执行

需要设置 KUDU_QUICKSTART_IP 参数,官网上写的是 export KUDU_QUICKSTART_IP=$(ifconfig | grep "inet " | grep -Fv 127.0.0.1 | awk '{print $2}' | tail -1) ,由于使用的客户端是 Windows 系统,无法执行官网提供的命令,这里可以直接把它配置在系统的环境变量中,key为 KUDU_QUICKSTART_IP,值为docker虚拟机IP eg. 192.168.1.123 执行 docker-compose -f quickstart.yml up -d

原以为这里只使用 quickstart.yml 就可以,结果发现文件中引用了当前目录,因此,有必要把工程clone下来再执行 docker-compose
第一次执行时可以不用 -d 参数,方便看日志。

2. 配置 impala

docker run -d --name kudu-impala --network="docker_default" \
  -p 21000:21000 -p 21050:21050 -p 25000:25000 -p 25010:25010 -p 25020:25020 \
  --memory=4096m apache/kudu:impala-latest impala

访问docker服务的 25000 端口即可看到界面

3. 连接测试

在cloudera上下载impala的jdbc驱动,下载免费,但是需要注册。

在 dbeaver 上配置jdbc,并设置driver类

dbeaver conn
Figure 1. 配置jdbc
dbeaver success
Figure 2. 成功连接

4. 测试添加数据

这里用的是网上下载的测试数据,共10w条

先创建表

create data sql
Figure 3. 创建表
import data
Figure 4. 导入数据

模拟集群就是不一样,这速度,可以先睡一觉…… 😂

running
Figure 5. 处理中
finished
Figure 6. 完成数据传输(非真实数据)

5. 总结

kudu+impala的docker测试环境很简单,官网说明也比较详细,不过需要修改一些docker的默认设置, 加上kudu的说明都是基于Linux或Mac系统,在Windows上测试需要有些处理docker的经验。

测试体验:

  1. 出乎意料的顺利,没碰到什么大坑,kudu做的这个体验版还是不错的

  2. 上传速度极慢,可能原因是这是用docker模拟的集群,资源有限,有时间再在正式集群环境上测试

  3. 数据可以顺利修改