구조화된 데이터의 모임
여러 사람이 공유하고 사용할 목적으로 만들어진 정보의 집합
* 테이블 : 행(Observation), 열(Feature)
2) 데이터 베이스의 종류
관계형 데이터 베이스 (RDB)
MySQL, MariaDB, Oracle (행, 열 구조화)
빅데이터 (NoSQL)
MongoDB, Hbase, Casandara : 행, 열 데이터가 아닌 하나의 데이터를 하나의 문서로 표현 (Document)
분산 확장이 가능해 대용량 데이터 처리에 용이
분석 업무에는 불편
3) 데이터베이스와 서버
웹사이트 -> 웹서버 -> DB서버
도메인 서버
4) SQL
데이터 베이스에 접근하고 데이터 베이스를 조작하는 언어 SElECT, FROM, WHERE, GROUP, BY, HAVING
5) MySQL 설치
6) MySQL Workbench
SQL 작성을 더 용이하게 하도록 만들어진 툴
SQL Script : SQL 작성 (데이터 조작 및 조회) Output : 실행 결과 출력 Management : 데이터 접근 권한 설정 Database : 데이터 베이스 리스트를 조회
7) 서버, GUI
웹서버
HTTP를 요청 받고, 웹페이지를 반환하는 서버 (AWS, Google Cloud Platform)
데이터베이스 서버
컴퓨터 프로그램이 제공하는 서버
DB GUI Tool (MySQL Workbench)
데이터 베이스 탐색, 사용자권한, 쿼리 작성을 쉽게 할 수 있는 기능 제공
8) 분석가, SQL
DBA(Database administrator) 데이터베이스 설치,구성,업그레이드,관리,감시,자료백업,복구,보전,보안(제어),성능
데이터 분석가 : DB를 사용하는 유저, 조회(SQL), 복잡한 로직의 데이터를 조회
1장 데이터베이스와 SQL
2장 SQL문법
3장 데이터 추가, 삭제, 갱신, 데이터 정합성
4장 자동차 매출 데이터를 이용한 리포트 작성
5장 상품 리뷰 데이터를 이용한 리포트 작성
6장 식품 배송 데이터 분석
7장 UK Commerce 데이터를 이용한 리포트 작성
8장 타이타닉 호 데이터 분석
9장 R, Python 연동