앎을 경계하기

[가짜연구소3기] Data Engineer

[가짜연구소 3기] 데이터 엔지니어링 35 - Loading multiple tables with joins

양갱맨 2021. 9. 4. 21:13

주제

키를 통해 테이블을 결합하는 조인에 대해 배웠다.


테이블 결합하기

  • Key는 데이터베이스 레코드를 식별할 수 있는 고유한 값으로 이뤄진 것을 말한다.
  • 키를 이용하여 여러 개의 테이블을 결합할 수 있다.

테이블 결합 예제

SELECT *
FROM hpd311calls
			JOIN weather
			ON hpd311calls.created_date = weather.date;

위 예제는 hpd311calls의 created_date와 weather의 date 를 통해 두 테이블을 연결한다.

두 테이블을 연결할 키는 동일한 타입이어야 한다.

결합 방법은 아래의 그림을 보면 더 이해하기 쉽다.

결합과 집계 함께 사용하기

SELECT hpd311calls.borough,
			 COUNT(*),
			 boro_census.total_population,
			 boro_census.housing_units
	FROM hpd311calls
			 JOIN boro_census
			 ON hpd311calls.borough = boro_census.borough
GROUP BY hpd311calls.borough;

hpd311calls 테이블과 boro_census 테이블을 연결하여 hpd311callsborough를 기준으로 그룹화하여 borough, 그룹별 행 개수, total_population, housing_units 데이터를 추출한다.