본문 바로가기
자격증/SQLD(SQL 개발자)

SQLD - 데이터 모델링의 이해

by 어쩌다개발 2022. 10. 24.
반응형

* 내용은 노랭이 책으로 유명한 SQL 자격검정 실전문제 책 및 SQL 가이드 책을 참고하였습니다.

1. 모델링의 특징
- 현실세계를 일정한 형식에 맞추어 표현하는 추상화의 의미를 가짐.
- 시스템 구현만을 위해 수행하는 타스크가 아니며, 시스템 구현을 포함한 업무분석 및 업무형상화를 하는 목적도 있음.
- 복잡한 현실을 제한된 언어나 표기법을 통해 이해하기 쉽게 하는 단순화의 의미를 가지고 있음.
- 애매모호함을 배제하고 누구나 이해가 가능하도록 정확하게 현상을 기술하는 정확화의 의미를 가짐.

2. 발생시점에 따른 엔터티 분류
- 기본/키엔터티
- 중심엔터티
- 행위엔터티

3. 데이터 모델링이 필요한 이유
- 업무정보를 구성하는 기초가 되는 정보들에 대해 일정한 표기법에 의해 표현함으로써 업무 내용을 정확하게 분석
- 분석된 모델을 가지고 데이터베이스를 생성하여 개발 및 데이터관리에 사용하기 위한 것
- 데이터베이스를 구축하기 위한 용도만으로 사용하는 것이 아닌 데이터 모델링 자체로서 업무를 설명하고 분석

4. 데이터 모델링이란
- 정보시스템을 구축하기 위한 데이터 관점의 업무 분석 기법
- 현실세계의 데이터에 대해 약속된 표기법에 의해 표현
- 데이터베이스를 구축하기 위한 분석/설계의 과정

5. 데이터 모델링 유의점
- 중복(duplication) : 데이터베이스가 여러 장소에 같은 정보를 저장하는 잘못을 하지 않도록 함.
- 비유연성(inflexibility) : 데이터 정의를 데이터의 사용 프로세스와 분리함으로써 데이터 모델링은 데이터 혹은 프로세스의 작은 변화가 애플리케이션과 데이터베이스에 중대한 변화를 일으킬 수 있는 가능성을 줄임.
- 비일관성(inconsistency) : 서로 연관된 다른 데이터와 모순된다는 고려 없이 일련의 데이터를 수정할 수 있기 때문에 비일관성이 발생할 수 있음. 모델링 시 상호 연관 관계에 대해 미리 정의하면 사전에 위험을 예방할 수 있음. 단. 연계성을 높이는 것은 데이터 모델이 업무 변경에 대해 취약하게 만드는 단점에 해당

6. 데이터 모델링 개념
- 개념점 데이터 모델링 : 추상화 수준이 높고, 업무 중심, 전사적 데이터 모델링, EA 수립시 많이 이용
- 논리적 데이터 모델링 : 시스템을 구축하고자 하는 업무에 대해 정확하게 속성, 관계 등을 표현, 재사용성 높음
- 물리적 데이터 모델링 : 실제로 데이터베이스에 이식할 수 있도록 저장 등 물리적인 성격을 고려하여 설계

7. 데이터베이스 스키마 구조 3단계
- 외부스키마 - 여러개의 사용자 관점으로 구성, 개별 사용자가 보는 개인적 DB 스키마(사용자 관점)
- 개념스키마 - 모든 사용자 관점을 통합한 조직 전체의 DB를 기술하는 스키마(통합 관점)
- 내부스키마 - DB가 물리적으로 저장된 형식(물리적 저장구조)

8. ERD
- ERD에서 엔터티를 어디에 배치하는가에 대한 문제는 필수사항은 아니지만 가독성 측면에서 중요.
(왼쪽에서 오른쪽, 위쪽에서 아래로 이동)
- 1976년 피터첸에 의해 Entity-Relationship Model이라는 표기법이 만들어짐.
- 관계의 명칭은 관계 표현에 있어서 매우 중요한 부분에 해당

9. ERD 작성 순서
1. 엔터티를 그린다. -> 2. 엔터티를 배치한다. -> 3. 관계를 설정한다. -> 4. 관계 참여도를 기술 -> 관계의 필수여부 기술

10. 엔터티의 특징
- 반드시 해당 업무에서 필요하고 관리하고자 하는 정보이어야 함.
- 유일한 식별자에 의해 식별이 가능해야 함.
- 영속적으로 전재하는 인스턴스의 집합이어야 함.(1개가 아닌 2개 이상)
- 엔터티는 업무 프로세스에 의해 이용되어야 함.
- 반드시 속성이 있어야 함.
- 다른 엔터티와 최소 한 개 이상의 관계가 있어야 함.

11. 발생시점에 따른 엔터티 분류
- 기본엔터티 : 그 업무에 원래 존재하는 정보로서 다른 엔터티와 관계에 의해 생성되지 않고 독립적으로 생성이 가능하고 자신은 타 엔터티의 부모의 역할을 하게 됨.
- 중심엔터티 : 기본엔터티로부터 발생되고 그 업무에 있어서 중심적인 역할을 함. 데이터의 양이 많이 발생되고 다른 엔터티와의 관계를 통해 많은 행위엔터티를 생성함.
- 행위엔터티 : 두 개 이상의 부모엔터티로부터 발생되고 자주 내용이 바뀌거나 데이터량이 증가. 분석 초기 단계에서는 잘 나타나지 않으며 상세 셀계단계나 프로세으와 상관 모델링을 진행하면서 도출됨.

12. 엔터티 이름 부여 방법
- 가능하면 현업업무에서 사용하는 용어를 사용
- 가능하면 약어를 사용하지 않음.
- 단수명사를 사용
- 모든 엔터티를 통틀어서 유일하게 이름이 부여되어야 함.
- 엔터티 생성의미대로 이름을 부여

13. 속성
업무에서 필요로 하는 인스턴스에서 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위

14. 엔터티, 인스턴스, 속성, 속성값의 관계
- 한 개의 엔터티는 두 개 이상의 인스턴스의 집합이어야 함.
- 한 개의 엔턴티는 두 개 이상의 속성을 가짐.
- 한 개의 속성은 한 개의 속성값을 가짐.

15. 속성의 특성에 따른 분류
- 기본 속성 : 업무로 추출한 모든 속성이 해당, 가장 일반적이고 많은 속성 차지. 코드성 데이터, 언테티를 식별하기 위해 부여된 일련번호, 그리고 다른 속성을 계산하거나 영향을 받아 생성된 속성을 제외한 모든 속성은 기본속성임.
- 설계 속성 : 업무상 필요한 데이터 이외에 데이터 모델링을 위해, 업무를 규칙화하기 위해 속성을 새로 만들거나 변형하여 정의하는 속성. 일련번호와 같은 속성은 단일한 식별자를 부여하기 위해 모델 상에서 새로 정의하는 설계 속성
- 파생 속성 : 다른 속성에 영향을 받아 발생하는 속성, 보통 계산된 값들이 이에 해당. 가급적 파생속성을 적게 정의하는 것이 좋음.

16. 도메인
각 속성은 가질 수 있는 값의 범위가 있는데 이를 그 속성의 도메인이라고 하며, 엔터티 내에서 속성에 대한 데이터 타입과 크기 그리고 제약사항을 지정.

17. 속성 명칭 부여
- 해당업무에서 사용하는 이름 부여
- 서술식 속성명은 사용하지 않음.
- 약어사용은 가급적 제한
- 전체 데이터모델에서 유일성 확보하는 것이 좋음.

18. 데이터모델링에서는 존재적 관계와 행위에 의한 관계를 구분하는 표기법이 없으며 단일화된 표기법을 사용함. UML에서는 연관관계와 의존관계에 대해 실선과 점선의 표기법으로 표현하게 되어 있음. 클래스다이어그램에서는 연관관계와 의존 관계로 표현.

19. 관계
- 관계는 존재적 관계와 행위에 의한 관계로 나눌 수 있음.
- 관계의 표기법은 관계명, 관계차수, 선택성(선택사양)의 3가지 개념으로 표현
- 부서와 사원 엔티티 간의 '소속' 관계는 존재적 관계의 사례임.
- 주문과 배송 엔터티 간의 '배송근거' 관계는 행위에 의한 관계의 사례임.

20. 관계의 표기법
- 관계명(Membership) : 관계의 이름
- 관계차수(Cardinality) : 1:1, 1:M, M:N
- 관계선택사양(Optionality) : 필수관계, 선택관계

21. 두 개의 엔터티 사이에 정의한 관계
- 두 개의 엔터티 사이에 관심 있는 연관규칙 존재하는가?
- 두 개의 엔터티 사이에 정보의 조합이 발생되는가?
- 업무기술서, 장표에 관계연결을 가능하게 하는 동사(Verb)가 있는가?
- 업무기술서, 장표에 관계연결에 대한 규칙이 서술되어 있는가?

22. 관계 읽기
- 기준(Source) 엔터티를 한 개 또는 각(Each)으로 읽음.
- 대상(Target) 엔터티의 관계참여도(하나, 하나 이상) 즉 개수를 읽음.
- 관계선택사양과 관계명을 읽음.

23. 주식별자 지정할 때 고려
- 주식별자에 의해 엔터티 내의 모든 인스턴스들이 유일하게 구분
- 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수
- 지정된 주식별자의 값은 자주 변하지 않는 것
- 주식별자가 지정되면 반드시 값이 들어와야 함.

24. 식별자 종류
- 주식별자, 보조식별자 : 엔터티 내에서 대표성을 가지는가?가 기준
- 내부식별자, 외부식별자 : 엔터티 내에서 스스로 생성되었는지 여부
- 복합식별자, 단일식별자 : 단일 속성으로 식별되었는가? 가 기준
- 본질식별자, 인조식별자 : 원래 업무적으로 의미가 있던 식별자 속성을 대체하여 일련번호와 같이 새롭게 만든 식별자를 구분

분류 식별자 설명
대표성 여부 주식별자 엔터티 내에서 각 어커런스를 구분할 수 있는 구분자이며, 타 엔터티와 참조관계를 연결할 수 있는 식별자
  보조식별자 자엔터티 내에서 각 어커런스를 구분할 수 있는 구분자이나 대표성을 가지지 못해 참조관계연결을 못함
스스로 생성 여부 내부 식별자 엔터티 내부에서 스스로 만들어지는 식별자
  외부 식별자 타 엔터티와의 관계를 통해 타 엔터티로부터 받아오는 식별자
속성의 수 단일 식별자 하나의 속성으로 구성된 식별자
  복합 식별자 둘 이상의 속성으로 구성된 식별자
대체 여부 본질 식별자 업무에 의해 만들어지는 식별자
  인조 식별자 업무적으로 만들어지지는 않지만 원조식별자가 복잡한 구성을 가지고 있기 때문에 인위적으로 만든 식별자



25. 주식별자의 특징
- 유일성 : 주식별자에 의해 엔터티내에 모든 인스턴스들을 유일하게 구분
- 최소성 : 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 함.
- 불변성 : 주식별자가 한 번 특정 엔터티에 지정되면 그 식별자의 값은 변하지 않아야 함.
- 존재성 : 주식별자가 지정되면 반드시 데이터 값이 존재해야 됨.

26. 식별자와 비식별자관계 비교

항목 식별자 관계 비식별자 관계
목적 강한 연결관계 표현 약한 연결관계 표현
자식 주식별자 영향 자식 주식별자의 구성에 포함 현자식 일반 속성에 포함
표기법 실선 표현 점선 표현
연결 고려사항 - 반드시 부모엔터티 종속
- 자식 주식별자구성에 부모 주식별자포함 필요
- 상속받은 주식별자속성을 타엔터티에 이전 필요
- 약한 종속관계
- 자식 주식별자구성을 독립적으로 구성
- 자식 주식별자구성에 부모 주식별자 부분 필요
- 상속받은 주식별자속성을 타 엔터티에 차단 필요
- 부모쪽의 관계참여가 선택 관계

 

반응형

'자격증 > SQLD(SQL 개발자)' 카테고리의 다른 글

SQLD - SQL 기본  (0) 2022.11.01
SQLD - 데이터 모델과 성능  (0) 2022.10.25
SQLD(SQL 개발자) 요약/요점정리  (0) 2022.10.24
[SQL활용] 그룹 함수  (0) 2017.12.06
[SQL 활용] 서브쿼리  (3) 2017.12.06

댓글