(Chapter 1) 07. Cluster Manager

Spark 2015/01/30 15:57 용비

Cluster Managers


Spark 하나의 node에서 수천 개의 compute node 효율적으로 성능을 높일 있도록 설계되었다.


Flexibility 극대화하기 위하여 Spark Hadoop YARN, Apache Mesos, Standalone Scheduler 불리는 Spark 자체의 간단한 cluster manager 등과 같은 각양각색의 cluster manager 실행할 있다.


Spark 처음 설치했을 때는, Standalone Scheduler 쉽게 시작하는 방법을 제공한다. 반대로 이미 YARN이나 Mesos Cluster 설치되어 있다면, Spark 이미 설치되어 있는 환경 상에서 application 실행할 있도록 지원한다.

받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/653

(Chapter 1) 06. GraphX

Spark 2015/01/30 15:56 용비

GraphX


GraphX Spark 0.9 추가된 graph 다루는 라이브러리이다. 병렬 그래프 분석을 처리한다. Spark Streaming Spark SQL 같이 GraphX RDD API 확장하여 임의의 properties vertex and edge (꼭지점과 ) 추가할 있다.


 GraphX 일반적인 그래프 알고리즘 (PageRank or Triangle Counting) 포함하여 graph 다루는 operation 지원한다.

받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/652

(Chapter 1) 05. MLlib

Spark 2015/01/30 15:55 용비

MLlib


Spark는 MLlib라고 불리는 common machine learning (ML) 기능의 라이브러리를 제공한다. MLlib 다양한 타입의 machine learning 알고리즘을 제공한다. (binary classification, regression, clustering,  collaborative filtering, model evaluation, data import)


또한 generic gradient descent optimization algorithm과 같은 lower level ML primitive 제공한다. 모든 method들은 cluster상에서 scale out 있도록 설계 되었다.

받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/651