DATA INSPIRED

[ADP] #1. 데이터의 이해 핵심 요약

1과목 ‘데이터의 이해’는 데이터의 기본 개념과 특성을 다루고, 데이터 탐색과 빅데이터 분석의 중요성을 강조합니다. 데이터의 유형, 특성, 수집 및 정제, 시각화 기법 등을 이해하고, 빅데이터 분석에서 데이터의 질, 기술, 인력의 중요성을 파악하는 것이 핵심입니다. 이를 통해 비즈니스 인사이트를 도출하고 전략적 의사결정을 지원할 수 있습니다

1장: 데이터의 개념과 특성

1. 데이터의 정의와 유형

  • 정형 데이터 (Structured Data): 고정된 필드에 저장되는 데이터 (예: 데이터베이스 테이블).
  • 비정형 데이터 (Unstructured Data): 구조화되지 않은 데이터 (예: 텍스트, 이미지, 동영상).
  • 반정형 데이터 (Semi-structured Data): 일정한 구조를 가지지만 완전히 정형화되지 않은 데이터 (예: XML, JSON).

2. 데이터의 특성

  • 볼륨 (Volume): 데이터의 양.
  • 속도 (Velocity): 데이터 생성 및 처리 속도.
  • 다양성 (Variety): 데이터의 형태 및 출처의 다양성.
  • 진실성 (Veracity): 데이터의 신뢰성과 정확성.

3. 데이터의 가치와 중요성

  • 데이터는 비즈니스 인사이트를 제공하고, 의사결정을 지원하며, 효율성을 향상시킵니다.

2장: 데이터 탐색 (Data Exploration)

1. 데이터 탐색의 목적과 중요성

  • 데이터의 기본 특성과 패턴을 이해하는 과정.
  • 데이터 탐색을 통해 데이터의 이상점, 패턴, 관계 등을 파악합니다.

2. 데이터 수집과 준비

  • 다양한 소스에서 데이터를 수집합니다 (예: 내부 시스템, 외부 소스).
  • 데이터 정제 (Data Cleaning): 결측치 처리, 중복 제거, 이상치 처리.
  • 데이터 변환 (Data Transformation): 정규화, 이산화, 특성 추출.

3. 데이터 시각화

  • 데이터의 특성과 패턴을 시각적으로 표현하여 쉽게 이해할 수 있도록 합니다.
  • 주요 기법: 히스토그램, 상자 그림, 산점도, 파이 차트 등.

3장: 빅데이터 분석 (Big Data Analysis)

1. 빅데이터 분석의 개요

  • 대규모 데이터 세트의 분석을 통해 유의미한 인사이트를 도출하는 과정.
  • 주요 단계: 데이터 수집, 정제, 저장, 처리, 분석, 시각화 및 해석.

2. 빅데이터 분석의 전략 인사이트

  • 빅데이터 열풍과 회의론: 빅데이터에 대한 기대와 비판.
  • 빅데이터 회의론의 원인 및 진단: 데이터 품질 문제, 분석 기술의 한계, 비용과 시간, 인력 부족.
  • 빅데이터 분석: ‘Big’이 핵심이 아니다: 데이터의 양보다 질이 중요.
  • 전략적 통찰이 없는 분석의 함정: 비즈니스 목표와 연계되지 않은 분석의 위험.

3. 빅데이터 활용의 3요소

  • 데이터 (Data): 다양한 소스와 유형, 데이터 품질 관리.
  • 기술 (Technology): 데이터 저장, 처리, 분석 기술 (예: 클라우드 컴퓨팅, 머신러닝).
  • 인력 (People): 숙련된 데이터 과학자, 엔지니어, 분석가의 필요성.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다