본문 바로가기

Data Science & Analytics

[리뷰] 데이터분석전문가 가이드북 정리

반응형

과목II : 데이터 처리 기술 이해

2장 데이터 처리 기술

제 3절 클라우드 인프라 기술

0. 개요

(정의)

클라우드 컴퓨팅이란, 동적으로 확장할 수 있는 가상화 자원들을 인터넷으로 서비스할 수 있는 기술

 

(종류)

- SaaS (Software as a Service)

- PaaS (Platform as a Service) 

- IaaS (Infrastructure as a Service) 

 

(예시)

- 아마존 S3 (Simple Storage Service), EC2 (Elastic Cloud Computing)

- 구글 AppEngine, Apps, Gears, Gadgets 

 

(근간 기술 - 서버가상화 기술)

- 인프라 기술

- 가장 기반이 되는 것은 서버 가상화 기술 

1) 서버 가상화 기술이란,

- 물리적인 서버와 운영체제 사이에서 적절한 계층을 추가해 서버를 사용하는 사용자에게 물리적인 자원은 숨기고 논리적인 자원만 보여주는 기술

- 서버 가상화를 가능하게 하는 기술은 다양하며, 메인프레임, 유닉스 서버, x86 서버 등에 따라 서로 다른 기술이나 분류체계가 사용됨

- 클라우드 컴퓨팅 환경에서 가장 많이 사용되는 서버가 x86 계열이기 때문에 x86 서버가상화 기술만 설명 

2) x86 계열군 서버의 가장 큰 특징은,

- 하드웨어, CPU, 운영체제의 공급 업체가 모두 다르다는 것

- 이러한 환경으로 인해 가상화 기술도 업체에 따라 제공되는 수준이 다양함

- 하드웨어 기반 CPU 가상화 : 인텔, AMD - CPU제공업체이기에 하드웨어 차원의

- 소프트웨어 기반 가상화 : VMware 나 마이크로소프트, 오픈소스 커뮤니티

3) 서버 가상화 기술 이용시 얻을 수 있는 효과

- 가상머신 사이의 데이터 보호

- 예측 못한 장애로부터의 보호

- 공유 자원에 대한 강제 사용의 거부

- 서버 통합

- 자원 할당에 대한 증가된 유연성

- 테스팅

- 정확하고 안전한 서버 사이징

- 시스템 관리 

 

1. CPU 가상화

1) 하이퍼바이저 (Hypervisor) 

- 가상머신, 물리적 서버 위에 존재하는 가상화 레이어를 통해 운영체제가 수행하는데 필요한 하드웨어 환경을 가상으로 만들어 줌

- Virtual Machine Monitor 라고도 불리며, 다음과 같은 기능을 수행

= 하드웨어 환경 에뮬레이션

= 실행환경 격리

= 시스템 자원 할당

= 소프트웨어 스택 보존

2) 완전 가상화 (Full Virtualization) 

- CPU뿐만 아니라 메모리, 네트워크 장치 등 모든 자원을 하이퍼바이저가 직접 제어/관리 하기 때문에 어떤 운영체제라도 수정하지 않고 설치가 가능한 장점 존재 

3) 하드웨어 지원 완전가상화 

4) 반가상화 (Para Virtualization) 

- privileged 명령어를 게스트 운영제어에서 hypercall 로 하이퍼바이저에 전달하고, 하이퍼바이저는 hypercall 에 대해서는 previlege 레벨에 상관없이 하드웨어로 명령을 수행 시킴

5) Monolithic vs. Microkernel

6) 호스트 기반 가상화 (Host based virtualization) 

7) 컨테이너 기반 가상화 (Container based virtualization)

- 호스트 운영체제 위에 가상의 운영체제를 구성하기 위한 운영 환경 계층을 추가하여 운영체제만을 가상화한 방식 

- 운영체제만 가상화 대상으로 하므로 전체 하드웨어를 대상으로 하는 하이퍼바이저 기반 가상화 방식에 비해 훨씬 적게 가상화 함

- 한 대의 서버에서 더 많은 컨테이너 실행 가능

- 가상화를 지원하는 계층을 하이퍼바이저라고 부르지 않고, 가상 운영환경 (Virtual server environment) 라고 부름 

- 장점 : 가상화 수준이 낮기 때문에 다른 방식에 비해 빠른 성능을 보임

- 단점 

= 자원간 격리 수준이 낮아 하나의 가상 운영체제에서 실행되는 애플리케이션의 자원 사용에 따라 다른 가상 운영체제가 영향을 받는 단점 존재

= 호스트 운영체제의 보안 취약성에 의해 모든 가상 운영체제에 문제 발생 가능

= 호스트 운영체제를 공유하기 때문에 호스트 운영체제의 문제가 전체 가상 운영체제에도 영향을 미치게 됨

- 컨테이너 기반 가상화 예시

= OpenVZ, OpenVZ 상용화 버전인 Virtuozzo, Solaris Containers, Linux-VServer 등 여러 솔루션 존재 

2. 메모리 가상화 : VMware 기법 

1) Memory ballooning

2) Transparent page sharing

3) Memory Overcommitment

3. I/O 가상화

1) 가상 이더넷

2) 공유 이더넷 어댑터

3) 가상 디스크 어댑터 

 

 

과목III : 데이터 분석 기획

제 2장 분석 마스터 플랜

제 1절 분석 마스터 플랜 수립

1. 분석 마스터 플랜 수립 프레임워크 

2. 수행 과제 도출 및 우선순위 평가

3. 이행계획 수립

 

제 2절 분석 거버넌스 체계 수립 

1. 거버넌스 체계 개요

2. 데이터 분석 성숙도 모델 및 수준 진단

3. 분석 지원 인프라 방안 수립 

4. 데이터 거버넌스 체계 수립 

가) 데이터 표준화 

나) 데이터 관리 체계

다) 데이터 저장소 관리 (Repository)

라) 표준화 활동

5. 데이터 조직 및 인력방안 수립

6. 분석 과제 관리 프로세스 수립

7. 분석 교육 및 변화관리

 

 

 

 

 

 

 

 

 

반응형
LIST