티스토리 뷰

데이터 표준화 원칙 정의

 

1.   데이터 표준화 요구사항 수집

-       현업 및 개발자로부터 데이터표준과 관련된 요구사항을 인터뷰 및 설문 조사 등을 통하여 조사함으로써 전사 데이터 표준 대상 후보를 식별하고 개선점을 도출하는 데 사용할 자료를 마련한다.

n  데이터 표준과 관련된 문제점을 조사할 때 유효한 방법 중 하나는 자신이 맡고 있는 영역과 다른 영역 간의 인터페이스 부분에서 발생하는 불편 사항 및 개선 사항을 파악하는 것이다. 영역이라는 것은 주제 영역 간 또는 정보 시스템 간 일 수 있다.

n  특정 영역에 대한 데이터 표준 요구사항을 조사할 때 해당 영역을 오랫동안 관리하여 온 담당자보다는 해당 영역에 대해 익숙치 않은 관련자의 관점이 오히려 더욱 유용하다.

 

2.   현행 데이터 표준 원칙 분석

가.  현행 데이터 표준 원칙 수집

n  현행 정보시스템 개발 지침 문서 및 데이터 표준의 확보
현행 데이터 표준 원칙은 기존 정보시스템을 개발할 당시 작성하고 적용되었던 개발 지침 문서 및 데이터 표준을 통하여 수집한다. 데이터 표준 개발 지침 문서로는 각종 객체(테이블, 칼럼 등)에 대한 명명 규칙 등이 있다.

n  현행 정보시스템 모델의 분석
현행 데이터 모델 또는 데이터베이스 스키마에서 보여지는 객체의 정의 패턴 분석을 통하여 정보시스템 구축 시 적용했던 원칙을 유추해 낼 수 있다. 그러나 유추해 낼 수 있는 데이터 표준 대상 및 관리 항목이 상당히 제한적이다.

 

나.  데이터 표준 원칙 사용 현황 분석

-       데이터 표준 대상별로 어떠한 정보시스템에 적용하고 있는지, 어떠한 관리항목을 관리하는지, 어떻게 상이하게 관리되고 있는지에 대해 조사한다.

 

3.   데이터 표준 개선 방안 정의

-       현행 데이터 표준 사용 현황 명세서와 표준 요구사항 정의서를 토대로 하여 데이터 표준 대상별 문제점 및 개선 방안을 도출한다.

-       문제점 및 개선 방안 도출 시 반드시 전사적인 관점에서 접근하며, 전사적 관리의 필요성을 검토하여 관련 데이터 표준 대상 또는 대상별 관리 항목을 신규로 정의하거나 정의 대상에서 제외한다.

-       또한 최종적으로 데이터 표준 개선 방안은 기존에 수립된 데이터 관리 정책에 부합하여야 한다.

 

4.   데이터 표준 원칙 수립

가.  데이터 표준 기본 원칙 정의

- 표준화 원칙의 예로는 한글명에 특수 기호를 사용하지 않거나, 영문명 표기 시 발음되는 대로 기술하는 것을 금지하거나, 이음동의어 사용 금지를 정의하는 것이다.

 

나.  데이터 표준 지침 작성

1)     데이터 표준 지침의 기본 구성

n  개요
데이터 표준화 및 데이터 표준 지침에 대한 목적을 기술한다.

n  데이터 표준화 관련자의 역할과 책임
데이터 표준화와 관련된 사용자들을 정의하고 그들의 역할 및 책임을 규정한다. 일반적으로 정의하는 관련자로는 전사 데이터 관리자, 데이터 관리자, 모델러 등이 있다.

n  데이터 표준 관리 절차
데이터 표준과 관련된 일련의 작업 프로세스를 규정하고, 프로세스별로 데이터 표준화 관련자들의 역할을 기술한다. 일반적으로 데이터 표준 관리 절차로는 데이터 표준 정의, 데이터 표준 변경, 데이터 표준 준수 프로세스가 있다.

n  데이터 표준 기본원칙

n  데이터 표준 대상별 명명 규칙

기술 내용

설명

사용 문자

알파벳, 한글, 숫자, 특수문자, 전각/반각 등의 허용 여부 또는 사용 조건을 규정한다.

영문 대소문자

알파벳을 사용할 경우 대소문자 사용과 관련한 규칙을 규정한다.

한글명과 영문명

동시 정의 여부

DBMS에 반영되는 객체들은 대부분 알파벳으로 정의하도록 되어 있는 경우가 있기 때문에 이와 관련된 데이터 표준정의 대상에 대해서는 한글명과 영문명의 정의가 필요하다. 일반적으로 표준 단어, 표준 용어가 이에 해당한다.

명칭의 구조

표준 용어를 사용하는 테이블명 및 칼럼명의 경우 명칭을 통하여 그 특성 또는 부가 정보를 표시할 수 있도록 명칭에 대한 단어 표준 조합 구조를 명시한다.

예) 수식어 + [수식어] + 속성유형(금액, 건수, 코드 등)

명칭에 대한 허용 길이

표준 용어를 사용하는 테이블명 및 칼럼명의 경우 DBMS의 물리적 특성으로 길이의 제약을 받기 때문에 표준 용어의 허용 길이를 명시해야 한다.

명칭 표준화에 대한

기준

유사한 개념의 단어/용어가 복수 개 존재할 경우 어떤 기준으로 표준 단어/표준 용어로 선택할 것인가를 결정하는 기준을 정의한다.

예) 일련번호, ID, SEQ -> ID로 표준화한다.

명칭에 대한 예

명칭에 대한 허용 길이, 명칭 구조 체계, 명칭 표준화 기준 등을 준수하여 작성된 샘플을 몇 가지 명시한다.

 

n  데이터 형식 정의에 대한 기준
일반적으로 표준 용어를 칼럼으로 사용하는 경우나 표준 도메인, 표준 코드에 대하여 데이터 형식 정의에 대한 기준을 정의한다. 표준 용어의 명칭에 대한 표준화 기준을 정의할 때 데이터 형식도 같이 정의함으로써 명칭의 결정과 동시에 데이터 형식도 자동적으로 결정된다.

n  기타
데이터 표준 대상별로 고유한 특성에 대해 원칙을 구체적으로 기술한다.

 

2)     주요 데이터 표준 대상별 지침의 일반적인 구성

n  표준 단어

l  한글명 및 영문명에 대한 알파벳, 한글, 숫자, 특수문자, 전각/반각 등의 허용 여부 또는 사용 조건

l  대소문자 사용 규칙

l  한글명, 영문명에 대한 허용 길이

l  합성어(단어의 조합으로 이루어진 단어) 정의에 대한 지침

l  접두사에 대한 처리 방안

l  동음이의어/이음동의어 허용 여부 및 처리 방안

n  표준 용어

l  데이터 명칭에 대한 구조 체계

l  한글명, 영문명에 대한 허용 길이

l  용어를 테이블이나 칼럼명으로 사용할 경우 준수해야 할 특이한 명명 규칙

l  용어를 칼럼명으로 사용할 경우 데이터 형식 표준화에 대한 기준 및 표준 도메인 적용 여부

n  표준 도메인

l  데이터 형식 표준화에 대한 기준

n  표준 코드

l  데이터 명치에 대한 구조체계 및 명명에 대한 기준

l  데이터 형식 표준화에 대한 기준

l  코드번호 체계 정의에 대한 규칙

 

3)     데이터 표준 개발 지침 작성 시 유의사항

- 단위 정보시스템의 영역을 벗어나 다른 정보시스템에서도 적용이 가능하도록 범용성을 고려하여 정의한다.

n  DBMS마다 허용하는 테이블 및 칼럼의 물리명 길이가 상이하다.따라서 용어에 대한 영문명의 허용 길이에 대한 지침을 정의할 때 적용 대상 DBMS에 모두 적용 가능하도록 고려해야 하며, 어려울 경우 영문 축약명을 추가로 정의하거나 뷰(View)를 사용하는 등 다른 대안을 마련한다.

n  DBMS마다 정의하고 있는 데이터 타입이 각기 상이하기 때문에 특정 DBMS 기준으로 데이터 형식을 정의할 경우 다른 DBMS에서는 다른 데이터 타입으로 적용되는 경우가 발생한다.

반응형
LIST
댓글
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함