本文主要记录了安装hadoop,hive,zookeeper,hbase,kylin的整个过程,其中各软件的版本如下:
- hadoop-2.7.3.tar.gz
- apache-hive-2.1.1-bin.tar.gz
- hbase-1.2.4-bin.tar.gz
- zookeeper-3.4.9.tar.gz
- apache-hive-2.1.1-bin.tar.gz
Some tips learning from “Ansible Up & Running”.
The repo of this book https://github.com/lorin/ansiblebook
PyLaTex
to generate tex
filexelatex
to generate PDFpdftk
原创翻译自Hadoop: The Definitive Guide, 4th Edition
Hadoop被设计用来处理很大量的数据。通常认为这些数据已经存储在HDFS,或者可以大量复制。然而,很多系统不满足这些假设。这些系统产生大量的数据流需要使用Hadoop结构化、存储、分析,Apache Flume就是被设计用来做这些工作的。
Flume被设计用来将大量数据驱动的数据传入Hadoop,典型应用场景是使用Flume收集银行web服务器的日志,然后将这些日志聚合到新的汇总文件并传入HDFS处理。通常的传输目的地(在Flume中的sink)是HDFS。然而,Flume足够灵活也能够写入到其他系统,例如HBase和Solr。
Ref from official site document.
This document describes how to install and configure Hadoop clusters ranging
from a few nodes to extremely large clusters with thousands of nodes. To play
with Hadoop, you may first want to install it on a single machine (see Single
Node Setup).
原创翻译自Hadoop官方文档
本文描述了如何在几个节点到成千上万节点的环境中安装和配置Hadoop集群。为了更好的使用Hadoop,首先应该在单节点服务器上安装(参考单节点安装Hadoop)。
本文未包括进阶主题,例如Security和高可用。
Ubuntu 14.04 LTS
elasticsearch 2.1.0
logstash 2.1.1
kibana 4.3.0
ELK works well for a couple of days, and then becomes unusable. curl localhost:9200
has no response.
Tested in Ubuntu 14.04.4 LTS
Docker version 1.10.2, build c3959b1