앎을 경계하기

[가짜연구소3기] Data Engineer

[가짜연구소 3기] 데이터 엔지니어링 - 5 SQL databases

양갱맨 2021. 8. 22. 11:54

주제

SQL이 산업 표준이고 데이터 엔지니어와 데이터 과학자들이 SQL을 다르게 사용하고 있다.

그리고 데이터베이스 스키마의 예를 보면서 배웠다.


SQL

  • SQL = Structured Query Language
  • 관계형 데이터베이스(RDBMS) 시스템을 쿼리하는데 선호되는 언어이다.
  • SQL을 사용하면 한 번에 많은 레코드에 접근할 수 있고 집계, 필터링, 그룹화를 할 수 있다.
  • 영어와 유사하기 때문에 이해와 사용이 쉽다.
  • 데이터 엔지니어들이 SQL을 사용해서 데이터베이스를 만들고 유지 관리한다.
  • 데이터 과학자들은 SQL을 사용해서 데이터베이스 쿼리를 한다.

데이터 엔지니어가 사용하는 SQL의 테이블 생성, 유지, 업데이트

CREATE TABLE employees(
		employee_id INT,
		first_name VARCHAR(255),
		last_name VARCHARa(255),
		role VARCHAR(255),
		team VARCHAR(255),
		full_time BOOLEAN,
		office VARCHAR(255)
);

데이터 과학자가 사용하는 SQL의 쿼리문

SELECT first_name, last_name
FROM employees
WHERE role LIKE '%Data%'

데이터베이스 스키마

데이터베이스는 여러 개의 테이블로 구성된다.

데이터베이스 스키마는 테이블이 관련되는 방식을 제어한다.

 

 

각 테이블의 정보와 테이블 간 관계를 나타내는 것으로 스키마를 이해할 수 있다.

공통되는 정보를 통해 각 테이블을 연결할 수 있기 때문에 "관계형" 데이터베이스 라고 한다.


SQL 구현 방법

  • SQLite
  • MySQL
  • PostgreSQL
  • Oracle SQL
  • SQL Server

 

 

Uploaded by Notion2Tistory v1.1.0