IT 트렌드
기업들이 주목하는 데이터 레이크와 데이터 패브릭이란?
데이터 레이크(Data Lake)의 개념과 특징데이터 레이크(Data Lake)란, 다양한 원천(원시) 데이터를 제한 없이 대규모로 저장할 수 있는 중앙 저장소를 말한다. 과거에는 전사적 데이터가 주로 데이터 웨어하우스(DW)에 모였지만, DW는 스키마를 미리 정의하고 정형화된 형태로 데이터를 적재해야 했다. 반면, 데이터 레이크는 텍스트, 로그, 이미지, 오디오, 영상, IoT 센서 정보 등 다양한 형태의 비정형 데이터를 원형 그대로 수용할 수 있다는 점이 가장 큰 장점이다. 이는 스키마가 정해지지 않은 데이터를 선(先) 적재 후(後) 분석(“Schema on Read”) 형태로 다룰 수 있게 만들어, 예측하기 어려운 분석 요구에도 유연하게 대응할 수 있게 해 준다. 데이터 레이크는 Hadoop, 클라..