스퐁지송 개발노트

SQL개발자 자격증 시험 공부 1.데이터 모델링의 이해 본문

카테고리 없음

SQL개발자 자격증 시험 공부 1.데이터 모델링의 이해

강준석 2023. 3. 13. 20:11
728x90

1. 데이터 모델링의 이해

 

데이터베이스의 모델링은 "현실 세계를 단순화하여 표현하는 기법"이다.

 

음식을 주문하는 행위를 모델링으로 표현한 것

 

이처럼 현실세계에서 일어날 수 있는 다양한 현상에 대해서 일정한 표기법에 의해 표현해 놓은 모형이라고 할 수 있으며

모델링은 이런 모델을 만들어가는 일이라고 할 수 있다.

 

1. 모델링이 갖춰야 할 조건

  • 현실세계를 반영해야 한다.
  • 단순화하여 표현해야 한다.
  • 관리하고자 하는 데이터를 모델로 설계한다.
  • 현실 세계를 반영한 모델을 단순화하여 표현한 것이다.

2. 모델링의 특징

  • 추상화 : 현실 세계를 일정한 형식으로 표현하는 것이다. 즉, 아이디어나 개념을 간력하게 표현하는 과정
  • 단순화 : 복잡한 현실 세계를 정해진 표기법으로 단순하고 쉽게 표현한다는 의미이다.
  • 명확화 : 불분명함을 제거하고 명확하게 해석할 수 있도록 기술한다는 의미이다.

정리 ) 데이터베이스의 모델링은 "현실세계를 추상화, 단순화, 명확화하기 위해 일정한 표기법에 의해 표현하는 기법" 이다.

 

데이터 모델링의 중요성 및 유의점

  • 중복 : 같은 시간 같은 데이터 제공
  • 비유연성 : 사소한 업무변화에 데이터 모델이 수시로 변결되면 안됨
  • 비일관성 : 신용 상태에 대한 갱신 없이 고객의 납부이력 정보 갱신 안됨 (연계성이 떨어진다)

좋은 데이터 모델의 요소

  1. 완전성 : 업무에 필요한 모든 데이터가 모델에 정의
  2. 중복배제 : 하나의 DB내 동일한 사실은 한번만
  3. 업무규칙 : 많은 규칙을 사용자가 공유하도록 제공
  4. 데이터 재사용 : 데이터가 독립적으로 설계되어야 함
  5. 의사소통 : 업무규칙은 엔터티, 서브타입, 속성, 관계 등의 형태로 최대한 자세히 표현
  6. 통합성 : 동일한 데이터는 한 번만 정의, 참조활용

데이터의 모델링

  • 개념적 데이터 모델링 : 추상화 수준이 높고 업무중심적이고 포괄적인 수준의 모델링 진행, 전사적데이터 모델링
  • 논리적 데이터 모델링 : 시스템을 구축하고자 하는 업무에 대해 Key, 속성, 관계등을 정확하게 표현, 재사용성이 높음
  • 물리적 데이터 모델링 : 실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계

데이터 독립성 요소

  • 외부 스키마 : View단계 여러 개의 사용자 관점으로 구성, 사용자가 보는 개인적 DB스키마(사용자 관점 접근하는 특성에 따른 스키마 구성)
  • 개념 스키마 : 구성 모든 사용자 관점을 통합한 조직 전테의 DB를 기술하는 것(통합관점)
  • 내부 스키마 : 내부단계, 내부 스키마로 구성, DB가 물리적으로 저장된 형식,  물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 스키마(물리적 저장구조)

데이터 독립성

  • 논리적 독립성 : 개념 스키마가 변경되어도 외부 스키마에 영향을 주지않는다. 논리적 구조가 변경되어도 으용 프로그램에 영행 없음
  • 물리적 독립성 : 내부스키마가 변경되어도 외부/개념 스키마는 영향을 받지 않도록 지원하는 것

Mapping(사상) : 상호 독립적인 개념을 연결시켜주는 다리

 

데이터 모델링의 세가지 요소

  • 업무가 관여하는 어떤 것(Things)
  • 어떤 것이 가지는 성격(Attributes)
  • 업무가 관여하는 어떤 것 간의 관계(Relationships)

사물이나 사건 등을 바라 볼 때 전체를 지징하는 용어를 어떤 것(Thing)이라고 하고, 그 어떤 것이 가지는 세부적인 사항을 성격(Attributes)이라고 할 수 있다. 또한 각각의 어떤 것은 다른 어떤 것과 연관성을 가질 수 있는데 이것을 관계(Relationship)라고 표현한다.

 

 

ERD 작업 순서

  1. 엔터티를 그림
  2. 엔터티를 적절하게 배치
  3. 엔터티간 관계를 설정
  4. 관계명을 기술
  5. 관계의 참여도를 기술
  6. 관계의 필수여부를 기술

 

용어의 구분정리

 

 

엔터티 : 업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합적인 것, 보이지 않은 개념 포함

 

엔터티의 특징

  1. 반드시 해당 업무에서 필요하고 관리하고자 함
  2. 유일한 식별자에 의해 식별 가능
  3. 두 개 이상의 인스턴스의 집합
  4. 업무 프로세스에 의해 이용되어야 함
  5. 반드시 속성이 있어야 함 (예외적으로 관계엔터티의 경우는 주식별자 속성만 가지고 있어도 엔터티로 인정)
  6. 다른 엔터티와 최소 1개 이상의 관계가 있어야 함 (관계를 생략하여 표현해야하는 경우는 통계성 엔터티, 코드성 엔터티, 시스템 처리시 내부 필요에 의한 엔터티 도출과 같은 경우)

 

엔터티의 분류

 

유무형에 따른 분류 : 유형, 개념, 사건 엔터티

  • 유형 : 물리적 형태, 안정적, 지속적 ex) 사원, 물품, 강사
  • 개념 : 개념적 정보, 물리적 형태 x ex) 조직, 보험상품
  • 사건 : 업무수행시 발생, 통계자료이용 ex) 주문, 청구, 미납

발생시점에 따른 분류 : 기본/키, 중심, 사건 엔터티

  • 기본 :  그 업무에 원래 존재하는 정보, 타 엔터티의 부모역활, 자신의 고유한 주식별자 가짐 ex) 사원,부서
  • 중심 : 기본 엔터티로부터 발생, 다른 엔터티와의 관계로 많은 행위 엔터티 생성 ex) 계약, 사고, 주문
  • 행위 : 2개 이상의 부모엔터티로부터 발생, 자주 바뀌거나 양이 증가 ex) 주문목록, 사원변경이력

 

엔터티의 명명

현업업무에서 사용하는 용어 사용, 약어 사용금지, 단수명사 사용, 고유한 이름 사용, 생성의미대로 부여

 


 

 

속성 : 업무에서 필요로 하는 인스턴스로 관리하고자 하는 의미상 분리되지 않는 최소의 데이터 단위

한 개의 엔터티는 2개 이상의 인스턴스 집합 

한 개의 엔터티는 2개 이상의 속성을 가짐

한 개의 속성은 1개의 속성값을 가짐

 

속성의 분류 : 기본, 설계, 파생 속성

  • 기본 : 업무로부터 추출한 모든 일반적인 속성
  • 설계 : 업무를 규칙화하기 위해 새로 만들거나 변형, 정의하는 속성  ex) 일련번호
  • 파생 : 다른 속성에 영향을 받아 발생하는 속성, 빠른 성능을 낼 수 있도록 원래 속성의 값을 계산 ex) 합

도메인 : 각 속성이 가질 수 있는 값의 범위 ex) 5글자

 

속성의 명명

  1. 해당업무에서 사용하는 이름 부여
  2. 서술식 속성명은 사용 금지
  3. 약어 사용 금지
  4. 전체 데이터모델에서 유일성 확보

관계 : 엔터티의 인스턴스 사이의 논리적인 연관성으로서 존재의 형태로서나 행위로서 서로에세 연관성이 부여된 상태

- 존재에 의한 관계 ex) 소속된가

- 행위에 의한 관계 ex) 주문한다

 

패어링 : 엔터티 안에 인스턴스가 개별적으로 관계를 가지는 것

 

UML에는 연관관계와 의존관계가 있는데, 연관(존재적)관계는 항상 이용하는 관계이고 의존관계는 상대방 행위에 의해 발생하는 관계이다.

ERD에서는 존재적 관계와 행위에 의한 관계를 구분하지않고 표기했지만 UML에서는 이를 구분하여 연관관계는 실선, 의존관계를 점선으로 표현

 

관계의 표기법

  • 관계명 : 관계의 이름
  • 관계차수 : 1:1, 1:M, M:N
  • 관계선택성(관계선택사양) : 필수관계, 선택관계

관계 체크사항

  1.  2개의 엔터티 사이에 관심있는 연관규칙이 있는가?
  2.  2개의 엔터티 사이에 정보의 조합이 발생하는 가?
  3. 업무기술서, 장표에 관계연결에 대한 규칙이 서술되어있는가?
  4. 업무기술서, 장표에 관계연결을 가능케하는 동사가 있는가?

 

식별자 : 엔터티내에서 인스턴스를 구분하는 구분자.  식별자는 논리 데이터 모델링 단계에 사용

              Key는 물리 데이터 모델링 단계에 사용

 

식별자의 특징 :  유일성, 최소성, 불변성, 존재성

  1. 주식별자에 의해 모든 인스턴스들이 유일하게 구분
  2. 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 함
  3. 지정된 주식별자의 값은 자주 변하지 않아야 함
  4. 주식별자가 지정이 되면 반드시 값이 들어와야 함

식별자 분류

대표성여부 : 주식별자, 보조식별자

주식별자 : 엔터티 내에서 각 어커런스를 구분할 수 있는 구분자, 타 엔터티와 참조관계를 연결할 수 있음

구분자, 타 엔터티와 참조관계를 연결할 수 있음

보조식별자 : 어커런스를 구분할 수 있는 구분자이나 대표성을 가지지 못해 참조관계 연결불가

 

스스로 생성여부 : 내부식별자, 외부식별자

내부식별자 : 스스로 생성되는 식별자

외부식별자 : 타 엔터티로부터 받아오는 식별자

 

속성의 수 : 단일식별자, 복합식별자

단일 식별자 : 하나의 속성으로 구성

복합 식별자 : 2개 이상의 속성으로 구성

 

대체 여부 : 본질식별자, 인조식별자

본질식별자 : 업무에 의해 만들어지는 식별자

인조식별자 : 인위적으로 만든 식별자

 

주식별자 도출기

  1.  해당 업무에서 자주 이용되는 속성임
  2.  명칭, 내역, 등과 같이 이름으로 기술되는 것들은 X
  3.  복합으로 주식별자로 구성할 경우 너무 많은 속성 X

식별자 관계

주식별자 : 자식의 주식별자로 부모의 주식별자 상속

   1. 부모로부터 받은 식별자를 자식엔터티의 주식별자로 이용하는 경우 강한 연결관계 표현, 실선표기

 

비식별자 : 부모 속성을 자식의 일반 속성으로 사용

  1. 부모 없는 자식이 생성될 수 있는 경우
  2. 부모와 자식의 생명주기가 다른 경우ㅇ
  3. 여러개의 엔터티가 하나의 엔터티로 통합되어 표현되었는데 각각의 엔터티가 별도의 관계를 가진 경우
  4. 자식엔터티에 별도의 주식별자를 생성하는 것이 더 유리한 경우
  5. SQL 문장이 길어져 복잡성 증가되는 것 방지 약한 연결관계 표현, 점선 표기, 자식 주식별자구성을 독립적으로 구성

 

 

    

 

 

 

 

728x90
Comments