  1. 2013/09/10 용비 Flume NG + Hadoop Log Collector Setting
  2. 2013/09/09 용비 Hadoop Clustering
  3. 2013/09/02 용비 인정받는다는 것
  4. 2013/08/22 용비 Embedded Jetty + Jersey Restful Setting
  5. 2013/08/11 용비 Maven을 쓸 수 밖에 없는 이유
[Flume Agent]

vi flume.conf

#### Configure for Flume Agent (Gateway Log Agent)

agentA.sources = gwSource
agentA.channels = gwChannel
agentA.sinks = gwSink

#### Configure for Source

# For each one of the sources, the type is defined
agentA.sources.gwSource.type = exec
agentA.sources.gwSource.command = tail -Fs 180 /home/yusbha/nginx/logs/access.log
agentA.sources.gwSource.restart = true
agentA.sources.gwSource.interceptors = i1
agentA.sources.gwSource.interceptors.i1.type = timestamp
agentA.sources.gwSource.channels = gwChannel

#### Configure for Channel

# Each channel's type is defined.
agentA.channels.gwChannel.type = file
agentA.channels.gwChannel.dataDirs = /home/yusbha/flume/file-channel/data/01
agentA.channels.gwChannel.checkpointDir = /home/yusbha/flume/file-channel/checkpoint/01

#### Configure for Sink
# Each sink's type must be defined
agentA.sinks.gwSink.type = avro
agentA.sinks.gwSink.hostname =
agentA.sinks.gwSink.port = 35853
agentA.sinks.gwSink.channel = gwChannel

Flume Agent 실행 Command

bin/flume-ng agent --conf conf --conf-file conf/flume.conf --name agentA -Dflume.root.logger=INFO,console

[Flume Collector]

vi flume.conf

#### Configure for Flume Agent (Gateway Log Collector)

collector.sources = collectorSource
collector.channels = collectorChannel
collector.sinks = HDFS

#### Configure for Source :

# For each one of the sources, the type is defined.
collector.sources.collectorSource.type = avro
collector.sources.collectorSource.bind =
collector.sources.collectorSource.port = 35853
collector.sources.collectorSource.channels = collectorChannel

#### Configure for Channel
collector.channels.collectorChannel.type = memory

#collector.channels.collectorChannel.type = file
#collector.channels.collectorChannel.dataDirs = /home/hadoop/flume/file-channel/data/01
#collector.channels.collectorChannel.checkpointDir = /home/hadoop/flume/file-channel/checkpoint/01
#collector.channels.collectorChannel.transactionCapacity = 1000
#collector.channels.collectorChannel.checkpointInterval = 30000
#collector.channels.collectorChannel.maxFileSize = 2146435071
#collector.channels.collectorChannel.minimumRequiredSpace = 524288000
#collector.channels.collectorChannel.keep-alive = 5
#collector.channels.collectorChannel.write-timeout = 10
#collector.channels.collectorChannel.checkpoint-timeout = 600
#collector.channels.collectorChannel.capacity = 500000

#### Configure for Sink
# Each sink's type must be defined
collector.sinks.HDFS.type = hdfs
collector.sinks.HDFS.hdfs.path = hdfs://name.odp.kt.com/logs
collector.sinks.HDFS.hdfs.filePrefix = %Y%m%d%H%M%S
collector.sinks.HDFS.hdfs.fileType = DataStream
collector.sinks.HDFS.hdfs.fileSuffix = .log
collector.sinks.HDFS.hdfs.inUseSuffix = .work

collector.sinks.HDFS.hdfs.maxOpenFiles = 200
collector.sinks.HDFS.hdfs.rollSize = 0
collector.sinks.HDFS.hdfs.rollInterval = 60
collector.sinks.HDFS.hdfs.rollCount = 0
collector.sinks.HDFS.hdfs.rollTimerPoolSize = 1
collector.sinks.HDFS.hdfs.batchSize = 100
collector.sinks.HDFS.hdfs.threadsPoolSize = 1
collector.sinks.HDFS.hdfs.callTimeout = 60000

collector.sinks.HDFS.hdfs.writeFormat = TEXT
collector.sinks.HDFS.serializer = text
collector.sinks.HDFS.serializer.appendNewline = true
collector.sinks.HDFS.channel = collectorChannel

Flume Agent 실행 Command

bin/flume-ng agent --conf conf --conf-file conf/flume.conf --name collector -Dflume.root.logger=INFO,console
Hadoop Clustering

Articles 2013/09/09 18:05 용비
OS : CentOS 6.4 64-bit
Java : OpenJDK 1.7
Hadoop : 1.2.1

1. 설치 서버
- Name Node : (name.odp.kt.com)
- Data Node : (data01.odp.kt.com)

2. OpenJDK 설치
- 실행 계정 : root
- 적용 서버 : 전체 서버 (name node, data node)
yum -y install *openJDK*

3. Hadoop 계정 추가
- 실행 계정 : root
- 적용 서버 : 전체 서버 (name node, data node)
groupadd hadoop
useradd -g hadoop hadoop
passwd hadoop

4. Host 설정
- 실행 계정 : root
- 적용 서버 : 전체 서버 (name node, data node)
vi /etc/hosts (hosts 파일 수정)
== 하단에 내용 추가 name.odp.kt.com data01.odp.kt.com

5. 방화벽 설정
- 실행 계정 : root
- 적용 서버 : 전체
service iptables stop
chkconfig iptables off

[NameNode 서버 설정]
1. 데이터 디렉토리 생성
- 실행 계정 : hadoop
- 적용 서버 : name.odp.kt.com
mkdir $HOME/data
mkdir $HOME/data/name

2. SSH 접근 제어 설정
- 실행 계정 : hadoop
- 적용 서버 : name.odp.kt.com
== SSH 키 생성
ssh-keygen -t rsa

== SSH 키 배포
ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@data01.odp.kt.com

3. Hadoop 설치
- 실행 계정 : hadoop
- 적용 서버 : name.odp.kt.com
- Hadoop Version : 1.1.2, 1.2.1
tar xvf hadoop-1.x.x-tar.gz

4. Hadoop 환경 설정
- 실행 계정 : hadoop
- 적용 서버 : name.odp.kt.com
vi hadoop-env.sh

export HADOOP_HOME=/home/hadoop/hadoop-1.2.1
# export JAVA_HOME=/usr/lib/jvm/jre-1.6.0-openjdk.x86_64
export JAVA_HOME=/usr/lib/jvm/jre-1.7.0-openjdk.x86_64
export HADOOP_OPTS=-server

vi core-site.xml


vi hdfs-site.xml


vi mapred-site.xml


vi conf/masters <= 수정 사항 없음. 일반적으로 secondary name node 정보 setup.

vi conf/slaves
== 아래 내용 추가

Hadoop 설치 폴더 배포
scp -r /home/hadoop/hadoop-1.2.1 data01.odp.kt.com:/home/hadoop/hadoop-1.2.1

환경설정 배포
rsync -av /home/hadoop/hadoop-1.2.1/conf hadoop@data01.odp.kt.com:/home/hadoop/hadoop-1.2.1

Hadoop 실행
== NameNode 포맷
./hadoop namenode -format

== Hadoop 시작

== Hadoop Console 확인
./hadoop dfsadmin -report

== Hadoop 종료

[DataNode 서버 설정]
- 실행 계정 : hadoop
- 적용 서버 : data01.odp.kt.com
mkdir $HOME/data
mkdir $HOME/data/node01
mkdir $HOME/data/node02

인정받는다는 것

Daily Memo 2013/09/02 18:59 용비
내가 가진 지식이라는 것은 어쩌면 살아가며 경험한 것들의 산물일 것이다.
그러한 지식을 기반으로 무언가를 한다는 것은 또한 살아 있음의 다른 말이 아닐지.
무언가를 하기 위해서, 아니 끈기를 갖고 무언가를 하기 위해서 필요한 것은 바로 동기부여가 아닐지.
가장 큰 동기부여는 바로 나의 일을, 나의 존재를 나 아닌 누군가로부터 인정받는 것이 아닐까 싶다.

사랑하는 아내, 자녀들, 부모, 형제, 가족들, 더 나아가 나를 아는 모든 지인들..
그들로부터 내가 존재 가치를 인정받고, 하고 있는 일이 가치 있음을 인정받을 때,
비로소 나의 존재함에 대한 가치도 있을 것이다.
나란 존재는 내가 판단하고 평가하는 것만이 전부는 아니니까.

요즘, 사람들로부터 인정받는다는 것에 대해서 많은 생각을 하게 된다.
가까이는 아내와 아이들, 형제들로부터 멀리는 어쩌다 한번 생각나는 과거의 인연들까지.
그들에게 나는 어떤 가치를 부여받고 있는 존재일까?
그리고 그들에게 나는 어떤 가치를 부여하고 있는가?

내가 철학자도 아니고, 성자는 더더욱 아니지만,
모두 다 부질없다는 생각을 문득 이 순간 하게 된다.

"내가 사람들에게 인정받으려고 이 한 세상 이렇게 살아가고 있는가?"

삶의 우선 순위, 그리고 내가 현재 살아가고 있는 목적을 잃어버리지 말자.

'과연 나는 무엇을 위해 살아가고 있는가?'
<Jetty Version : 9.0.4>
필수 Jetty Library : jetty-servlet, servlet-api (Maven으로 의존관계의 Library 관리)
private static final String JERSEY_RESOURCES = "리소스패키지(ex. net.yongbi.rest)";

Server server = new Server(port);
ServletContextHandler context = new ServletContextHandler(ServletContextHandler.SESSIONS);
ServletHolder h = new ServletHolder(new ServletContainer());
h.setInitParameter("com.sun.jersey.config.property.packages", JERSEY_RESOURCES);
context.addServlet(h, "/*");


[개발하는 프로그램 언어를 가리지 않고, 사용하는 개발툴 가리지 않는다.]

평소 가지고 있는 생각이다.
언어가 뭐가 되었건 간에 크게 다르지 않으므로 전혀 새로운 언어라도 뚝.딱. 익혀서 프로그램을 개발할 수 있고, 개발 툴이 무엇이건 간에 그것도 뚝.딱. 익혀서 개발할 수 있다는 생각을 갖고 있기 때문이다.

하지만, 최근에 eclipse로 개발을 진행하면서 maven 프로젝트를 생성하고 작업을 하고 나니...
maven을 쓰면 굉장히 편해짐을 경험하고 maven을 사용할 수 밖에 없음!이라고 마음 한켠에 생각을 심어두고 있다.

가장 골치아픈 참조라이브러리를 알아서 관리해주고, 패키지를 말 때는 의존관계에 있는 모든 라이브러리들을 한방에 모아주는 기능까지.. (물론 eclipse maven plugin-m2 플러그인에서는 안 된다.)

그동안 생짜로 라이브러리들을 하나하나 추가하여 java 프로그램 개발했는데, 요번에 maven을 사용해 보니 개발이 굉장히 쉽다는 생각이 들었다.

역시 대세에는 이유가 있다.
