install kylin hive hbase hadoop

Posted on 2017-01-20 |

本文主要记录了安装hadoop，hive，zookeeper，hbase，kylin的整个过程，其中各软件的版本如下：

hadoop-2.7.3.tar.gz
apache-hive-2.1.1-bin.tar.gz
hbase-1.2.4-bin.tar.gz
zookeeper-3.4.9.tar.gz
apache-hive-2.1.1-bin.tar.gz

Tips of Ansible Up and Running

Posted on 2016-10-12 |

Some tips learning from “Ansible Up & Running”.
The repo of this book https://github.com/lorin/ansiblebook

Python decorator notes

Posted on 2016-09-28 |

基本定义

装饰器背后的主要动机源自Python面向对象编程。装饰品是在函数调用之上的装饰，装饰品语法以@开头，接着是装饰器函数的名字和可选的参数，紧跟着装饰器声明的是被修饰的函数和装饰函数的可选参数，看起来会是这样：

@decorator(dec_opt_args)
def func2Bdecorated(func_opt_args):
    :

set api gateway using kong

Posted on 2016-09-06 |

开源软件kong已可实现api gateway，即作为api网关，转发至后端各api，可以减少后端api认证，访问次数限制等的开发，减少端口暴露。该软件主要由Lua和nginx实现，后端数据库连接可选Cassandra和PostgreSQL

本文测试环境kong连接的为本机的Cassandra（注:kong版本为0.9.0,Cassandra版本为2.2.7。kong目前仅支持2.1,2.2版本的Cassandra，参见issue）

generate PDF by PyLaTex

Posted on 2016-08-05 |

using PyLaTex to generate tex file
compiled by xelatex to generate PDF
merge PDFs by pdftk
Read more »

flume introduction

Posted on 2016-06-20 |

原创翻译自Hadoop: The Definitive Guide, 4th Edition

Hadoop被设计用来处理很大量的数据。通常认为这些数据已经存储在HDFS，或者可以大量复制。然而，很多系统不满足这些假设。这些系统产生大量的数据流需要使用Hadoop结构化、存储、分析，Apache Flume就是被设计用来做这些工作的。

Flume被设计用来将大量数据驱动的数据传入Hadoop，典型应用场景是使用Flume收集银行web服务器的日志，然后将这些日志聚合到新的汇总文件并传入HDFS处理。通常的传输目的地(在Flume中的sink)是HDFS。然而，Flume足够灵活也能够写入到其他系统，例如HBase和Solr。

Hadoop Cluster Setup

Posted on 2016-05-30 |

Ref from official site document.

Purpose

This document describes how to install and configure Hadoop clusters ranging
from a few nodes to extremely large clusters with thousands of nodes. To play
with Hadoop, you may first want to install it on a single machine (see Single
Node Setup).

Hadoop集群设置

Posted on 2016-05-30 |

原创翻译自Hadoop官方文档

目的

本文描述了如何在几个节点到成千上万节点的环境中安装和配置Hadoop集群。为了更好的使用Hadoop，首先应该在单节点服务器上安装（参考单节点安装Hadoop）。

本文未包括进阶主题，例如Security和高可用。

elasticsearch down for heap size

Posted on 2016-05-24 |

Ubuntu 14.04 LTS elasticsearch 2.1.0 logstash 2.1.1 kibana 4.3.0 ELK works well for a couple of days, and then becomes unusable. curl localhost:9200 has no response.

deploy gitlab by Docker

Posted on 2016-03-28 |

Tested in Ubuntu 14.04.4 LTS Docker version 1.10.2, build c3959b1