-
[데이터 웨어하우스] Star schema에 대한 간단 요약Database 2023. 2. 15. 11:16
데이터 웨어하우스의 기본 개념인 Star schema와 Snowflake schema에 대해서 정리해보자.
우선 개념에 대해 설명하자면,
Star 스키마란?
데이터 웨어하우스를 구성하기 위한 가장 간단한 구조로, 여러 Dimension table과 하나 이상의 Fact table로 구성된다.
목적 : 비즈니스와 관련된 수치를 선별하여 Fact table에 설명하고 자세한 내용은 Dimension으로 분리하는 것이다.
이때 Fact 데이터에는 가격, 중량, 속도, 수량과 같은 수치형 데이터가 포함되고, Dimension 데이터에는 색상, 모델 이름, 지리적 위치, 직원 이름 등 수많은 사항이 포함된다.
아래의 wikipedia에서 주어진 사진을 참고하여 이해해보자.
Star schema 장점
- Fact table과 Dimension table만 join하여 SQL query를 더 간단하고 빠르게 만든다.
단점
- 데이터 무결성 감소 (간단한 삽입 또는 단순 업데이트 명령은 데이터 불일치 유발 가능)
- 다양하고 복잡한 쿼리를 처리하는 역량 감소
- 다대다 관계에 적합하지 않다.
왜 더 빠를까?
왜 빠를까? 라는 질문은 스타 스키마의 목표에서부터 출발한다.
스타 스키마는 방대한 양의 데이터를 빠르게 읽고 분석 속도를 높이기 위해 사용한다.
그리고 Dimension table에서 "비정규화"를 통해 Join query의 속도를 높인다.
'Database' 카테고리의 다른 글
postgreSQL에서 Auto Increment 사용하기 (0) 2023.04.19 [SQL] SET FOREIGN_KEY_CHECKS와 외래키 제약조건 (0) 2023.03.29 [대용량 시스템] Scale-up 과 Scale-out의 장단점 (0) 2023.02.21 [데이터 웨어하우스] Snowflake schema에 대한 간단 요약 (0) 2023.02.20 데이터 웨어하우스 - DW 용어 정리 (0) 2023.02.14