반응형
/********************************************************************************************
-- Title : (dBNuri) 데이터웨어하우징 개요
-- Reference : 실무자를 위한 데이터웨어하우스(대청미디어.장동인)
                     OLAP 테크놀로지(SigmaInsight.조재희.박성진)
                     00000 교육센터 DW 교육과정
                     외 다수 데이터웨어하우스 관련 블로그 및 사이트
-- Key word : DW Data Warehouse Warehousing 데이터웨어하우스 데이터웨어하우징
********************************************************************************************/
-- 아래 내용들은 상단에 언급된 레퍼런스를 참조한 것들이고 잘못 이해한 것들이 있을 수 있습니다.
-- 틀린 부분은 언제나 Feedback 주십시오.


데이터웨어하우스(이하 DW)의 정의
기업의 운영계 시스템에서 생긴 내부데이터(Internal Data)와 외부데이터(External Data)를 주제별로(Subject Oriented) 통합하여 별도의 프로그래밍 없이(End-User Computing) 즉시(On-Line) 여러 각도에서 분석(Multi-Dimensioal Analysis) 가능한 통합시스템이다.
-- 언제나 정의는 단어속에 함축시겨서 어렵습니다.^^;;;
-- 간단히 풀어 헤치면, 기업에서 의사 결정을 내리기 위해 과거 다양한 방법으로 데이터를 처리했는데
    그 한계(비효율성, 비일관성, 데이터 오류, 분산된 데이터, 운영계 시스템 상이 등)를 해결하기 위해
    데이터를 한 곳에 모아두고 다양한 사용자가 쉽게 접근해서 최적의 성능으로 의사 결정의 자료를
    추출할 수 있는 공간, 즉 데이터 창고라고 생각하면 될 듯 싶다.



DW 등장 배경
ㅇ 데이터 산재/불일치, 상이한 정보시스템으로 인한 정보 처리 곤란.
ㅇ 경쟁사 우위 달성, 전략적 의사 결정의 신속성, 효율적 목표 시장 접근, 고객 관계형 마케팅 필요
    등의 요구 사항.
ㅇ 하드웨어, 소프트웨어, 데이터베이스, 스토리지, 네트워크등의 기술 발달.
ㅇ Client/Server, Internet, End-User Computing의 발전.
-- 과거의 정보시스템은 짧은 트랜잭션 데이터를 처리하는 시스템이었고 이를 바탕으로 의사 결정을
    진행해 왔지만, Global 경쟁의 심화와 더불어 고객의 다양한 요구에 따른 수익률 저하는 기업의 
    경영 정보에 대한 중요성을 필요로 하게 된다. 더불어 다양한 기술의 발달로 새로운 사업 모델이
    등장하면서 DW에 대한 요구가 등장하게 된다.
 


DW의 특성
ㅇ 주제 지향성(Subject Orientation)
ㅇ 통합(Integration)
ㅇ 비휘발성(Non Volatility)
ㅇ 시계열성(Time Varient)
-- 주제 지향성은 Application을 중심을 수집되어지던 데이터가 특정 주제를 중심으로 수집됨을 의미
    한다. (자동차보험, 생명보험, 손실보험 => 고객, 판매, 영업, 상품)
-- 통합은 사용자 요구에 맞게 의미있는 동일 데이터를 표준화하여 통합하는 과정을 의미한다.
    (운영계에서 남여를 1/0, Male/Female, 남/여 =>  F/M)
-- 비휘발성은 데이터 조작에 있어 대량의 로드와 검색이 주가되어 데이터의 변경의 없음을 의미한다.
    (주기적인 데이터 갱신을 생각하면 변경이기는 운영계의 수정/삭제 개념이 아니라는 뜻.)
-- 시계열성은 운영계에서 데이터를 액세스하는 순간에 의미가 있다면 DW에서는 일정 시간동안의
    데이터가 나타내는 의미가 데이터를 대변한다는 뜻이다.(어렵죠..ㅡ.ㅡ)



DW vs. DM(이하 데이터마트)
ㅇ 데이터마트 : 특정 사용자 집단에 주로 요구되는 데이터만 DW에서 따로 구축하여 제공하는 저장고.
ㅇ 종속형 DM vs. 독립형 DM
-- DW가 소비자들에게 판매하기 위해 상품을 체계적으로 분류하고 저장, 분해하는 기능을 하는 도매
    상이라면, DM은 도매상과 소비자 사이에 위치하는 소매상으로 비유될 수 있다.
-- 종속형 DM : DW에서 특정 사용자에게 제공될 데이터를 DM으로 구축한 경우.
    독립형 DM : DW가 아닌 운영계 데이터에서 직접 DM을 구축한 경우.



DW 도입 목적
ㅇ 1세대 : 의사결정 지원 시스템
ㅇ 2세대 : 전통적인 데이터웨어하우징
ㅇ 차세대 : 실시간 데이터웨어하우징
-- 1세대 : 보다 나은 BI 제공, 검색/접근/분석에 소요되는 시간 절감, 분산된 데이터 통합등의 활용.
-- 2세대 : eCRM을 위한 고객 데이터 추가,
-- 차세대 : DW부터 운영계 트랜잭션까지 루프백을 마무리 짓는 양방향 프로세스의 통합 BI 구현.



DW 구축 유형
ㅇ 집중형 DW
ㅇ 분산형 DW
ㅇ DM을 가진 DW
-- 집중형 DW는 운영계의 상세 데이터를 중앙 집중화 저장하여 여러 사용자 그룹이 분석 할 수 있도록
    허용한다.
-- 분산형 DW는 특정 사용자 그룹이 활용할 수 있도록 운영계 데이터를 모아 둔 Subset을 말한다.
-- DM을 가진 DW는 DW에서 데이터가 일련의 특정한 사용 요구에 의해 선택된 특별 목적용의 Subset
    을 말한다.
※ 분산형 DW와 DM을 가진 DW가 구분이 잘 안되는데, 분산형의 DW에서 Subset은 설계에서 Subject
    Area를 생각하면 될 듯 싶고, DM을 가진 DW에서의 Subset은 DW와 구분되는 System으로 보면
    될 듯 싶습니다...(ㅡ,.ㅡ)



DW 도입 효과
ㅇ 마케팅 경쟁력 확보
ㅇ 고객 서비스 강화
ㅇ 기업 내부 데이터 신뢰성
ㅇ 기업 내부 프로세스/시스템 향상
    => 경쟁력 있는 기업으로의 도약
-- 결국 기업의 경쟁력 확보가 아니겠습니까...^0^''

반응형

+ Recent posts