우연히 무료로 풀린 Architecting Data Lake (저자 : Alice LaPlante & Ben Sharma. 출판사 : 미국의 기술서적 전문 출판사인 O'Reilly Media, 2016년)를 보게 되었습니다.
대용량 데이터 처리 시대에 Data Lake는 우리 주변에서 자주 접하는 용어입니다만, 개발자 개인이 일반 현장에서 실제로 적용하며 경험해 보기에는 쉽지 않은 영역입니다. 바로 대용량 데이터가 필요하기 때문입니다.
예나 지금이나 대용량 데이터는 수많은 고객들을 상대로 성공한 서비스나 플랫폼, 디바이스들을 보유한 회사에서나 만져볼 수 있습니다. 소위 Enterprise 환경에서나 대용량 데이터에 대한 수행 경험을 쌓을 수 있다는 뜻입니다.
마침, 최근에 IoT의 한 분야라고 할 수 있는 에너지 관련하여 람다 아키텍처가 적용된 Data Lake 시스템을 Hadoop 기반으로 설계를 한 적이 있습니다. 그때의 경험과 Architecting Data Lake라는 책을 읽으며 중요한 부분만을 요약하여 많은 분들과 공유를 해보고자 합니다.
물론 O'Reilly사에 허락을 받지는 않았습니다만, 모든 사람들 대상으로 무료 Ebook으로 풀었으니 저작권 문제가 없을 거라고 혼자서 가정을 했습니다. 저작권 문제가 있다면 지우거나 공유를 취소해야겠죠. 관련 지식을 함께 나누고자 하는 의도로 O'Reilly사에서도 무료로 전체 오픈을 한 것이라고 믿고, 저도 또한 많은 분들과 자유롭게 관련 지식을 공유하고 싶어서 시작해 봅니다.
댓글을 달아 주세요
댓글 RSS 주소 : http://www.yongbi.net/rss/comment/798