과목II : 데이터 처리 기술 이해
2장 데이터 처리 기술
제 3절 클라우드 인프라 기술
0. 개요
(정의)
클라우드 컴퓨팅이란, 동적으로 확장할 수 있는 가상화 자원들을 인터넷으로 서비스할 수 있는 기술
(종류)
- SaaS (Software as a Service)
- PaaS (Platform as a Service)
- IaaS (Infrastructure as a Service)
(예시)
- 아마존 S3 (Simple Storage Service), EC2 (Elastic Cloud Computing)
- 구글 AppEngine, Apps, Gears, Gadgets
(근간 기술 - 서버가상화 기술)
- 인프라 기술
- 가장 기반이 되는 것은 서버 가상화 기술
1) 서버 가상화 기술이란,
- 물리적인 서버와 운영체제 사이에서 적절한 계층을 추가해 서버를 사용하는 사용자에게 물리적인 자원은 숨기고 논리적인 자원만 보여주는 기술
- 서버 가상화를 가능하게 하는 기술은 다양하며, 메인프레임, 유닉스 서버, x86 서버 등에 따라 서로 다른 기술이나 분류체계가 사용됨
- 클라우드 컴퓨팅 환경에서 가장 많이 사용되는 서버가 x86 계열이기 때문에 x86 서버가상화 기술만 설명
2) x86 계열군 서버의 가장 큰 특징은,
- 하드웨어, CPU, 운영체제의 공급 업체가 모두 다르다는 것
- 이러한 환경으로 인해 가상화 기술도 업체에 따라 제공되는 수준이 다양함
- 하드웨어 기반 CPU 가상화 : 인텔, AMD - CPU제공업체이기에 하드웨어 차원의
- 소프트웨어 기반 가상화 : VMware 나 마이크로소프트, 오픈소스 커뮤니티
3) 서버 가상화 기술 이용시 얻을 수 있는 효과
- 가상머신 사이의 데이터 보호
- 예측 못한 장애로부터의 보호
- 공유 자원에 대한 강제 사용의 거부
- 서버 통합
- 자원 할당에 대한 증가된 유연성
- 테스팅
- 정확하고 안전한 서버 사이징
- 시스템 관리
1. CPU 가상화
1) 하이퍼바이저 (Hypervisor)
- 가상머신, 물리적 서버 위에 존재하는 가상화 레이어를 통해 운영체제가 수행하는데 필요한 하드웨어 환경을 가상으로 만들어 줌
- Virtual Machine Monitor 라고도 불리며, 다음과 같은 기능을 수행
= 하드웨어 환경 에뮬레이션
= 실행환경 격리
= 시스템 자원 할당
= 소프트웨어 스택 보존
2) 완전 가상화 (Full Virtualization)
- CPU뿐만 아니라 메모리, 네트워크 장치 등 모든 자원을 하이퍼바이저가 직접 제어/관리 하기 때문에 어떤 운영체제라도 수정하지 않고 설치가 가능한 장점 존재
3) 하드웨어 지원 완전가상화
4) 반가상화 (Para Virtualization)
- privileged 명령어를 게스트 운영제어에서 hypercall 로 하이퍼바이저에 전달하고, 하이퍼바이저는 hypercall 에 대해서는 previlege 레벨에 상관없이 하드웨어로 명령을 수행 시킴
5) Monolithic vs. Microkernel
6) 호스트 기반 가상화 (Host based virtualization)
7) 컨테이너 기반 가상화 (Container based virtualization)
- 호스트 운영체제 위에 가상의 운영체제를 구성하기 위한 운영 환경 계층을 추가하여 운영체제만을 가상화한 방식
- 운영체제만 가상화 대상으로 하므로 전체 하드웨어를 대상으로 하는 하이퍼바이저 기반 가상화 방식에 비해 훨씬 적게 가상화 함
- 한 대의 서버에서 더 많은 컨테이너 실행 가능
- 가상화를 지원하는 계층을 하이퍼바이저라고 부르지 않고, 가상 운영환경 (Virtual server environment) 라고 부름
- 장점 : 가상화 수준이 낮기 때문에 다른 방식에 비해 빠른 성능을 보임
- 단점
= 자원간 격리 수준이 낮아 하나의 가상 운영체제에서 실행되는 애플리케이션의 자원 사용에 따라 다른 가상 운영체제가 영향을 받는 단점 존재
= 호스트 운영체제의 보안 취약성에 의해 모든 가상 운영체제에 문제 발생 가능
= 호스트 운영체제를 공유하기 때문에 호스트 운영체제의 문제가 전체 가상 운영체제에도 영향을 미치게 됨
- 컨테이너 기반 가상화 예시
= OpenVZ, OpenVZ 상용화 버전인 Virtuozzo, Solaris Containers, Linux-VServer 등 여러 솔루션 존재
2. 메모리 가상화 : VMware 기법
1) Memory ballooning
2) Transparent page sharing
3) Memory Overcommitment
3. I/O 가상화
1) 가상 이더넷
2) 공유 이더넷 어댑터
3) 가상 디스크 어댑터
과목III : 데이터 분석 기획
제 2장 분석 마스터 플랜
제 1절 분석 마스터 플랜 수립
1. 분석 마스터 플랜 수립 프레임워크
2. 수행 과제 도출 및 우선순위 평가
3. 이행계획 수립
제 2절 분석 거버넌스 체계 수립
1. 거버넌스 체계 개요
2. 데이터 분석 성숙도 모델 및 수준 진단
3. 분석 지원 인프라 방안 수립
4. 데이터 거버넌스 체계 수립
가) 데이터 표준화
나) 데이터 관리 체계
다) 데이터 저장소 관리 (Repository)
라) 표준화 활동
5. 데이터 조직 및 인력방안 수립
6. 분석 과제 관리 프로세스 수립
7. 분석 교육 및 변화관리
'Data Science & Analytics' 카테고리의 다른 글
빅데이터분석기사시험 공부 (0) | 2024.06.18 |
---|---|
[Databricks] The Big Book of Data Science Use cases (0) | 2024.04.25 |
[Coursera] Google Data Analytics, Advanced Data analytics 인증서 내용 비교 (1) | 2023.04.22 |
[Data Visualization] Plot area color in python (0) | 2023.02.12 |
[Library review] NetworkX 에 대해 알아보자 (0) | 2023.02.04 |