(기존의 레거시 도구를 수정하기)
두번째 방법은 EDW용으로 설계된 어플리케이션과 프로세스를 활용하는 것입니다. Informatica, IBM InfoSphere DataStage, AB Initio와 같은 소프트웨어 툴들은 변환을 수행하기 위해 필요한 ETL Grid의 모든 프로세스인, EDW로 깨끗한 데이터를 적재할 때 사용했던 것과 동일한 ETL 프로세스를 수행할 수 있습니다. Data Lake로 데이터를 적재할 때 이 소프트웨어들을 사용할 수 있습니다.
그러나, 이러한 방법은 비용이 많은 드는 경향이 있습니다. 또한, 단지 엔터프라이즈급 Data Lake에 필요한 관리와 거버넌스 기능들 중 일부만 처리합니다. 또다른 주요 단점은 ETL이 Hadoop Cluster의 외부에서 일어나기 때문에 각 쿼리에 대한 데이터가 외부로 이동해야 하므로 동작이 느려지고, 비용이 추가된다는 것입니다.
댓글을 달아 주세요
댓글 RSS 주소 : http://www.yongbi.net/rss/comment/806