링크드인이 오픈소스 데이터 분석 기술 ‘웨어하우’를 3월3일 공개했다. 데이터 분석할 때 필요한 메타데이터가 ‘어디에(Where)’에 있고 ‘어떻게(how)’ 찾을 수 있는지 알려주는 소프트웨어다.
웨어하우는 하둡분산 시스템, 하이브 데이터 웨어하우스, 테라데이터 등 다양한 데이터 시스템과 통합되며, 관련 메타데이터를 주기적으로 추출한다. 이를 이용하면 데이터 흐름을 시각화하고, 쉽게 탐색할 수 있으며 그래픽 UI나 API 형태로 이용할 수 있다.