목록Certification (38)
습관처럼
1.데이터 유형 - 숫자 타입 ANSI/ISO 기준 : NUMERIC, DECIMAL, DEC, SMALLINT, INTEGER, INT, BIGINT, FLOAT, REAL, DOUBLE PRECISION SQL Server와 Sybase : 작은 정수형, 정수형, 큰 정수형, 실수형 등 + MONEY, SMALLMONEY Oracle : 숫자형 타입에 대해서 NUMBER 한 가지 숫자 타입의 데이터 유형만 지원 - 벤더에서 ANSI/ISO 표준을 사용할 때는 기능을 중심으로 구현하므로, 일반적으로 표준과 다른 용어를 사용하는 것이 허용 (ex: NUMERIC → NUMBER, WINDOW FUNCTION → ANALYTIC/RANK FUNCTION) - 테이블의 칼럼이 가지고 있는 대표적인 4가지 데..
1. 데이터베이스 (정의) 특정 기업이나 조직 또는 개인이 필요에 의해(ex: 부가가치가 발생하는) 데이터를 일정한 형태로 저장해 놓은 것. (데이터베이스 관리 소프트웨어) -> DBMS(Database Management System) ■ 데이터베이스의 발전 - 1960년대 : 플로우차트 중심의 개발 방법 - 1970년대 : 계층형(Hierarchical) 데이터베이스, 망형(Network) 데이터베이스 같은 제품 - 1980년대 : 관계형 데이터베이스가 상용화되었으며 Oracle, Sybase, DB2와 같은 제품 - 1990년대 : 객체 관계형 데이터베이스로 Oracle, Sybase, Informix, DB2, Teradata, SQL Server ■ 관계형 데이터베이스(Relational D..
슈퍼/서브타입 모델의 성능고려 방법 가. 슈퍼/서브타입 데이터 모델(Extended ER Model)의 개요 최근 가장 많이 쓰임 이유) 업무를 구성하는 데이터를 공통과 차이점을 특징을 고려하여 효과적으로 표현할 수 있기 때문 공통의 부분 >> 슈퍼타입 공통으로부터 상속받아 다른 엔티티와 차이가 있는 속성 >> 서브타입 논리적 데이터 모델에서 이용되는 형태이며, 분석단계에서 많이 쓰이는 모델 물리적 데이터 모델로 설계시의 문제점이 나타남 이유) 적당한 노하우가 없음 결과) 1:1 타입이 되거나 All in one 타입이 되어버림 -> 성능저하 나. 슈퍼/서브타입 데이터 모델의 변환 - 성능저하의 원인 3가지 1) 트랜젝션은 항상 일괄로 처리하는데 테이블은 개별로 유지되어 Union 연산에 의..
대량 데이터발생에 따른 테이블 분할 개요 - 차선이 넓은 도로에서 정체현상? ** 테이블 분할 설계를 통한 성능 저하의 예방 1) 수평분할 : 컬럼 단위로 분할하여 I/O(Input/Output) 경감 2) 수직분할 : 로우 단위로 분할하여 I/O 경감 ** 성능저하의 원인 1) 하나의 테이블에 데이터 대량집중 : 한 테이블에 데이터가 대량으로 집중될때 테이블 구조가 너무 커져서 효율성이 떨어져 테이버를 처리할 때 디스크 I/O를 많이 유발하게 된다. 2) 하나의 테이블에 여러개의 컬럼 존재 : 이 경우 디스크의 점유량이 높아지고 데이터를 읽는 I/O량이 많아져서 성능이 저하된다. 3) 대량의 데이터가 처리되는 테이블의 경우 : SQL문장에서 데이터를 처리하기 위한 I/O의 양이 증가한다. 인덱스를 적절..
반정규화를 통한 성능향상 전략 가. 반정규화의 정의 반정규화를 정의하면 정규화된 엔터티, 속성, 관계에 대해 시스템의 성능향상, 개발(Development)과 운영(Maintenance)의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링의 기법을 의미 협의의 반정규화는 데이터를 중복하여 성능을 향상시키기 위한 기법이라고 정의할 수 있고 좀 더 넓은 의미의 반정규화는 성능을 향상시키기 위해 정규화된 데이터 모델에서 중복, 통합, 분리 등을 수행하는 모든 과정을 의미한다. 데이터 무결성이 깨질 수 있는 위험을 무릅쓰고 데이터를 중복하여 반정규화를 적용하는 이유는 데이터를 조회할 때 디스크 I/O량이 많아서 성능이 저하되거나 경로가 너무 멀어 조인으로 인한 성능저하가 예상되거나 칼럼을 계..
1. 정규화를 통한 성능 향상 전략 정규화란? 다양한 유형의 검사를 통해 데이터 모델을 좀더 구조화하고 개선시켜 나가는 절차에 관련된 이론이다.데이터 모델링을 하면서 정규화를 하는 것은 기본적으로 데이터에 대한 중복성을 제거하여 주고 데이터가 관심사별로 처리되는 경우가 많기 때문에 성능이 향상되는 특징을 가지고 있다. 데이터처리의 성능이 무엇인지 정확히 구분하여 인식할 필요가 있다.데이터베이스에서 데이터를 처리할 때 성능이라고 하면 조회 성능과 입력/수정/삭제 성능의 두 부류로 구분된다. 이 두 가지 성능이 모두 우수하면 좋겠지만 데이터 모델을 구성하는 방식에 따라 두 성능이 Trade-Off 되어 나타나는 경우가 많이 있다. 정규화를 수행한다는 것은 데이터를 결정하는 결정자에 의해 함수적 종속을 가지고..
1. 성능 데이터 모델링의 정의 데이터의 용량의 커지고 기업의 의사결정의 속도가 빨라질수록 데이터를 처리하는 속도는 빠르게 처리되어야 할 필요성을 반증해 준다. 성능이 저하되는 데이터 모델의 경우 크게 세 가지 경우를 고려하여 그 성능을 향상시킬 수 있다. 데이터 모델 구조에 의해 성능 저하 데이터가 대용량이 됨으로 인해 불가피하게 성능 저하 인덱스 특성을 충분히 고려하지 않고 인덱스를 생성함으로 인해 성능 저하 성능 데이터 모델링이 단순히 반정규화만을 의미하지 않음을 주목해야 한다. 성능데이터 모델링은 정규화를 통해서도 수행할 수 있고 인덱스의 특징을 고려해서 칼럼의 순서도 변형할 수 있다.또한 대량의 데이터특성에 따라 비록 정규화된 모델이라도 테이블을 수직 또는 수평 분할하여 적용하는 방법도 있고..
1. 모델링의 이해 가. 모델링의 정의 모델 : 모형(模型), 축소형(縮小型)의 의미로서 사람이 살아가면서 나타날 수 있는 다양한 현상에 대해서 일정한 표기법에 의해 표현해 놓은 모형 ☞ 커뮤니케이션의 효율성을 극대화한 고급화된 표현방법 모델링 : 표기법에 의해 규칙을 가지고 표기하는 것. 즉, 모델을 만들어가는 일 자체 나. 모델링의 특징 1) 추상화(모형화, 가설적) : 현실세계를 일정한 형식에 맞추어 표현을 한다는 의미. 즉, 다양한 현상을 일정한 양식인 표기법에 의해 표현 2) 단순화 : 복잡한 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 하는 개념 3) 명확화 : 누구나 이해하기 쉽게 하기 위해 대상에 대한 애매모호함을 제거하고 정확(正確..