단계 | 주요 의미 | 예 |
사실(Facts) | - 사업의 특정 단면이나 활동을 수치로 표현한 값
| |
차원(Dimensions) | - 주어진 사실에 대한 추가적인 관점(View)을 제공하는 특성
- 차원 테이블(Dimension Table)에 저장됨
- 1개의 사실 테이블에 여러 차원의 테이블이 연결되어 분석에 사용됨
| |
속성(Attribute) | - 각 차원 테이블이 가지고 있는 속성
- 사실을 검색하고, 여과하고 분류할 때 사용됨
| |
속성 계층(Hierarchies) | - 차원 내에 정의된 속성들 간에 존재하는 관계
- 아래로 가기(Drill-down) 및 위로 가기(Roll-up) 등의 기능 사용
| |
스타 스키마(Star Schema)
정의
- 스타 스키마라는 용어는 구성된 데이터 모델의 모양에서 비롯된 것
- 데이터 모델의 한 가운데에 위치한 사실 테이블(Fact Table)이 있으며, 그 주위를 많은 수의 차원 테이블(Dimension Table)이 둘러싸고 있는 형태
- 사실 테이블과 차원 테이블 사이는 ER 다이어그램에서와 같이 관계 표시선을 연결하여 상호간의 관계를 표시
구성 요소
사실 테이블
- 업무상 중요한 수치 데이터를 중앙에 위치한 테이블에 사실로 저장
- 기본키는 모든 차원의 키를 결합한 키
- 주로 연속적인 값들로 가산이 가능하여 집계된 값을 얻기 쉬움
차원 테이블
- 사용자의 분석 요인들을 저의(예: 시간, 매장, 상품 등)
- 각 차원은 계층적 구조를 가짐
- 사실 테이블 주변에 위치하며, 일반적으로 크기가 작음
질의 유형 : 드릴다운, 드릴업 등
- Drill-down - 분석할 항목에 대해 차원의 계층 구조를 따라 단계적으로 요약된 형태의 데이터 수준에서 보다 구체적인 내용의 상세 데이터로 접근하는 기능
- Drill-up -분석할 항목에 대해 한 차원의 계층 구조를 따라 단계적으로 구체적인 내용의 상세 데이터로부터 요약된 형태의 데이터로 접근하는 기능
특징
- 정규화되지 않음
- 조인 횟수가 적게 되어 검색 성능이 향상
구성도 및 예
Snowflake Schema
데이터 웨어하우스 효과와 고려할 점
데이터 웨어하우스 구축 성공 요인
- 효과적인 의사 결정 지원 업무의 선택
- 분석에 적합한 모델링 기술
- 손쉽게 사용 가능한 도구의 선택
- 의사 결정 지원 프로세스의 가치 부여
데이터 웨어하우스의 장점
- 높은 투자 수익률(ROI)
- 타사에 비해 경쟁 우위를 획득
- 의사 결정자의 생산성을 향상
데이터 웨어하우스의 단점
- 기존의 시스템가 명확한 역할을 설정하지 못하면 업무의 혼란을 초래할 수 있음
- 추출 기준에 맞지 않는 데이터의 입력, 갱신, 삭제가 발생하면 불일치 문제가 발생할 수 있음
- 의사 결정을 위한 충분한 데이터가 확보되지 않으면 정확한 결과를 도출할 수 없음
- 과다한 자원을 사용하게 되고 유지보수가 어려움
데이터 웨어하우스 유지시 고려할 점
데이터 마트(Data Mart)