ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [데이터베이스개론] Ch1. 데이터베이스 기본 개념
    DB 2024. 7. 15. 02:24
    728x90

    1. 데이터베이스의 필요성

    데이터 : 현실 세계에서 관찰하거나 측정하여 수집한 사실이나 값, 자료

    정보 : 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물

    목장에서 짠 원유가 데이터이고, 고객을 위해 공장에서 가공하여 팩에 담는 우유가 정보입니다.

     

    정보처리 : 데이터에서 정보를 추출하는 과정 또는 방법, 즉 데이터를 상황에 맞게 분석하거나 해석하여 데이터 간의 의미 관계를 파악하는 것

     

    현재성과 정확성을 보장하는 가치 있는 정보를 얻으려면 현재 상황을 정확히 판단하고 측정하여 의미 있는 데이터를 많이 수집해야 합니다.

    데이터를 많이 수집하는데 그쳐서는 안되고, 수집한 데이터를 효율적으로 저장했다가 필요할 때 언제든지 사용할 수 있어야 합니다.

    유용하게 활용할 수 있는 정보를 정확히 추출할 수 있도록 데이터를 대신 관리해주는 역할은 데이터베이스가 담당합니다.

     

    정보 시스템 : 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단

    정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 핵심 역할은 데이터베이스가 담당한다.

     

    데이터베이스 정의

    데이터베이스 : 특정 조직의 여러 사용자가 ‘공유’하여 사용할 수 있도록 ‘통합’해서 ‘저장’한 ‘운영’ 데이터의 집합

    데이터베이스는 공유 데이터(shared data)

    데이터베이스는 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야 하는 공용 데이터입니다.

    따라서 사용 목적이 다른 사용자들을 고려하여 데이터베이스를 구성해야합니다.

     

    데이터베이스는 통합 데이터(integrated data)

    데이터베이스는 데이터 중복성, 즉 똑같은 데이터가 여러 개 존재하는 것을 허용하지 않습니다. 데이터가 중복되면 관리하기 어려운 문제가 발생할 수 있기 때문입니다.

    하지만 효율성 때문에 중복을 의도적으로 허용하는 경우도 있으므로, 통합 데이터는 데이터의 중복을 최소화하고 통제가 가능한 중복만 허용하는 데이터라는 의미로 이해해야 합니다.

     

    데이터베이스는 저장 데이터(stored data)

    데이터베이스의 데이터는 주로 컴퓨터가 처리하므로, 컴퓨터가 접근할 수 있는 매체에 데이터베이스를 저장해야 합니다.

     

    데이터베이스는 운영 데이터(operational data)

    데이터베이스는 조직을 운영하고 조직의 주요 기능을 수행하기 위해 꼭 필요합니다. 일시적으로 사용하고 끝나는것이 아니라 지속적으로 유지해야하는 데이터입니다.

     

    데이터베이스 특징

    데이터베이스는 실시간 접근(real-time accessibility)이 가능합니다.

    데이터베이스는 사용자의 요구에 실시간으로 응답할 수 있어야 합니다.

    실시간 처리에서는 대개 몇 초를 넘지 않는 시간 내에 데이터를 제공할 수 있어야 합니다.

     

    데이터베이스는 계속 변화(continuous evolution)합니다.

    데이터베이스는 현실 세계의 상태를 정확히 반영해야 의미가 있습니다. 현실 세계는 끊임없이 변하므로 데이터베이스에 저장된 데이터도 계속 변해야 합니다. 즉, 데이터를 삽입, 삭제, 수정하여 현재의 정확한 데이터를 유지해야 합니다.

     

    데이터베이스는 동시 공유(concurrent sharing)가 가능합니다.

    데이터베이스는 여러 사용자가 동시에 이용할 수 있는 동시 공유의 특징을 제공해야 합니다.

    여러 사용자가 서로 다른 데이터를 동시에 사용하는 것뿐만 아니라 같은 데이터를 동시에 사용하는 것도 모두 지원한다는 의미입니다.

     

    데이터베이스는 내용으로 참조(content reference)가 가능합니다.

    저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있습니다.

     

    형태에 따른 데이터 분류

    • 정형 데이터(structured data)
      • 구조화된 데이터
      • 미리 정해진 구조에 따라 저장된 데이터
      • 엑셀, 관계 데이터베이스의 테이블
      스키마 : 미리 정해진 데이터 구조
    • 반정형 데이터(semi-structured data)
      • 구조에 따라 저장된 데이터
      • 내용 안에 구조에 대한 설명이 존재
      • 구조를 파악하는 파싱 과정이 필요
      • HTML, XML, JSON
      내용과 함께 설명된 데이터 구조를 스키마 또는 메타 데이터라고도 한다.
    • 비정형 데이터(unstructured data)
      • 정해진 구조가 없이 저장된 데이터
      • 영상, 이미지, 음성 등

     

    특성에 따른 데이터 분류

    • 범주형 데이터
      • 명목형 데이터
        • 서열이 없는 값을 가지는 데이터
      • 순서형 데이터
        • 서열이 있는 값을 가지는 데이터
    • 범주형 데이터는 범주로 구분할 수 있는 값, 즉 종류를 나타내는 값을 가진 데이터를 의미한다. 대부분 문자 타입의 값으로, 양적 측면에서 크기 비교와 산술적 연산이 불가능하기 때문에 질적 데이터라고도 한다. 범주형 데이터는 서열을 시준으로 명목형 데이터와 순서형 데이터로 나눌 수 있다.
    • 수치형 데이터
      • 이산형 데이터
        • 단절된 숫자 값을 가지는 데이터
      • 연속형 데이터
        • 연속적으로 이어진 숫자 값을 가지는 데이터
    • 양적 측면에서 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터, 양적 데이터라고도 한다.

    💡 여러 기준으로 데이터를 분류하고 데이터에 대해 이해하는 것이 중요하다.

     

    728x90
Designed by Tistory.