728x90
디비디비딥 스터디 시리즈
4장 데이터베이스와 아키텍처 구성: 견고하고 고속의 시스템을 구축하기 위해
아키텍처란
- 아키텍처는 시스템을 만들기 위한 물리 레벨의 조합. 이를 시스템이 완수해야할 목적과 비교하면서 결정해가는 것이 아키텍처 설계
- 아키텍처를 보면 그 시스템이 어떤 용도로 사용되고 무엇을 목적으로 하고 있는지를 어느정도 추측할 수 있다.
- 모든 시스템은 예산 제약이라는 한계 존재 -> 아키텍처의 설계는 매우 중요하다.
데이터베이스의 아키텍처 - 1. 역사와 개요
Stand-alone (~1980s)
- DB 서버가 LAN이나 인터넷 등의 네트워크에 접속하지 않고 독립되어 동작하는 구성
- DBMS와 애플리케이션 소프트웨어가 같은 DB 서버에서 동작 (= 물리적으로 접근해야)
- 네트워크로 침입할 위험이 없어 보안이 매우 높음
- 물리적으로 떨어진 장소의 접근 / 복수의 사용자 사용 불가
- 가용성이 낮음 (서버 1대에 장애가 발생하면 서비스 정지)
- 확장성 부족 (서버나 부품을 교환하는 방법 뿐이며 교환시 시스템 정지로 가용성 낮춤)
Client/Server (1990s~2000)
- 서버 1대에 복수 사용자의 단말이 접속하는 구성 (= 2계층 구성)
- DB 서버에서는 DBMS가 동작 / 클라이언트에서는 업무 애플리케이션이 동작하는 분업체제
- 클라이언트: 엔드 사용자가 직접 조작해 수행하고 싶은 처리 명형을 내보내는 머신
- 서버: 클라이언트로부터 받은 명령을 실행해 업무 처리(비즈니스 로직)를 실행하기 위한 머신
- 인터넷에서 직접 데이터베이스에 접속하는 것에 대한 보안 위험 존재
- 불특정 다수의 사용자가 사용하는 클라이언트에서의 애플리케이션 관리비용이 많이 듦]
Web 3계층 (2000~)
- 웹 서버 계층: 클라이언트로부터 접속 요청(HTTP 요청)을 직접 받아 애플리케이션 계층(애플리케이션 서버)에 넘기고 그 결과를 클라이언트에 반환
- 애플리케이션 계층: 비즈니스 로직을 구현한 애플리케이션에서 동작하는 층
- 웹 서버로부터 연계된 요청을 처리하고 필요 시 DB 서버에 접속하여 데이터 추출 후 가공한 결과를 웹 서버로 반환 (ex. 톰캣, 웹로직 등)
- 사용자로부터 직접적인 접속 요청을 받는 역할을 웹 서버 계층에 한정하여 애플리케이션 계층과 데이터베이스 계층의 보안을 높임
- 애플리케이션 계층에 비즈니스 로직을 집중하여 애플리케이션 관리 비용을 낮춤
- 데이터베이스 계층
데이터베이스의 아키텍처 - 2. 가용성과 확장성의 확보
- 가용성
- 사용자 입장에서 볼 때 시스템을 어느 정도 사용할 수 있는지. 사용자 관점
- 시스템이 서비스 제공시간에 장애 없이 서비스를 지속할 수 있는 비율
- 서버 2대가 있다면 1대가 고장나더라도 나머지 1대가 동작하면 서비스의 정지를 막을 수 있음
- cf) 신뢰성: 하드웨어나 소프트웨어가 고장나는 빈도(고장률)나 고장 기간. 시스템 컴포넌트 관점
- 가용성 전략
- 심장 전략(고품질-소수전략): 시스템을 구성하는 각 컴포넌트의 신뢰성을 높여 장애 발생률을 낮게 억제하여 가용성을 높임
- 신장 전략(저품질-다수전략): 시스템을 구성하는 각 컴포넌트의 신뢰성을 계속해서 높이기보다는 사물은 언젠가 망가진다란 체념을 전제로 여분을 준비
- 클러스터
- 동일한 기능의 컴포넌트를 여러 개 준비하여 한 개의 기능을 실현
- 클러스터링
- 신장 전략처럼 동일한 기능의 컴포넌트를 병렬화하는 것
- 여유도(Redundancy) 확보 또는 다중화: 클러스터 구성으로 시스템 가동률을 높이는 것
- 단일 장애점(SPOF, Single Point of Failure)
- 다중화되어 있지 않아 시스템 전체 서비스의 계속성에 영향을 주는 컴포넌트
DB 서버의 다중화 - 클러스터링
Active-Active
- 클러스터를 구성하는 컴포넌트를 동시에 가동
- 시스템 다운 시간이 짧고 성능이 좋음
- 저장소에 병목 현상 발생 가능
Active-Standby
- 실제 가동하는 것은 Active, 남은 것은 대기(Standby)하다가 Active DB에 장애가 생기면 가동 -> 전환까지의 시차 발생 (이때 다운 상태)
- Standby는 일정 간격으로 Active에 Heartbeat를 보내 이상이 없는지 확인. 응답이 없다면 Active가 다운된 것을 감지
- Cold-Standby: 평소에는 Standby가 작동하지 않다가 Active가 다운된 시점에 작동
- Hot-Standby: 평소에도 Standby가 작동. 전환 시간이 짧지만 라이선스료 높음
DB 서버와 데이터의 다중화 - 리플리케이션
- DB 서버와 저장소를 세트로 다중화
- RAID (Redundant Array of Independent Disks)
- 저장소 내부의 컴포넌트(대부분 하드디스크)를 다중화하는 기술
- 기본적으로 클러스터링과 동일하게 단일 장애점을 없앰
- Standby에 데이터 갱신을 반영하여 동기화하지 않으면 데이터 정합성 유지 불가
- 갱신 주기에 따라 정합성과 성능 사이에 trade-off 발생
- 피라미드형 Replication
- 데이터가 오래되어도 참조만 하면 되는 처리를 child set에서 처리
- parent set에 걸리는 부하 분산
- 그만큼 DB 서버의 라이선스료와 서버, 저장소의 비용, 구성 노력 증가
- Master-Slave 방식: Active-Standby 형식의 Replication
- Multi Master 방식: 양방향 Replication
성능을 추구하기 위한 다중화 - Shared Nothing
Shared Disk
- 복수의 서버가 1대의 저장소를 사용하는 구성
- Shared Disk 타입의 Active-Active 구성은 DB를 아무리 늘려도 처리율에 한계가 있음
- 저장소가 공유자원이라 쉽게 늘리기 어렵고 DB 서버 대수가 증가할수록 정보공유를 위한 오버헤드가 큼
Shared Nothing
- 네트워크 이외의 자원을 모두 분리. 아무것도 공유하지 않음
- 서버와 저장소의 세트를 늘리면 병렬 처리로 성능이 선형적 향상
- 비용 대비 성능이 좋음
- 각 서버의 DB 서버가 동일한 1개의 데이터에 액세스 불가
- DB 서버 하나가 다운되었을 때 다른 DB 서버가 이를 이어받아 계속 처리할 수 있게 하는 Covering 구성 고려 필요
'Book' 카테고리의 다른 글
[데이터베이스 첫걸음] 6장 (0) | 2023.09.09 |
---|---|
[데이터베이스 첫걸음] 5장 (0) | 2023.09.09 |
[데이터베이스 첫걸음] 3장 (0) | 2023.09.01 |
[데이터베이스 첫걸음] 2장 (0) | 2023.08.31 |
[데이터베이스 첫걸음] 1장 (0) | 2023.08.31 |
댓글