앎을 경계하기

[가짜연구소3기] Data Engineer

[가짜연구소 3기] 데이터 엔지니어링 36 - Introduction to JSON

양갱맨 2021. 9. 4. 21:13

주제

JSON 파일에 대한 개념과 Pandas로 읽는 방법에 대해 배웠다.


JSON

JSON은 웹에서 데이터 전송을 하는 일반적인 형식이다.

테이블 형태가 아니라서 데이터를 더 유연하게 저장할 수 있다.

파이썬의 dictionary 타입처럼 속성-값 쌍을 포함한다.

JSON 읽기

  • read_json() 으로 읽을 수 있다.
  • dtype으로 구체적인 타입을 설정할 수 있다.
  • JSON 데이터는 테이블 형태가 아니라서 다양하게 배치될 수 있기 때문에 orient키워드를 사용해서 레이아웃 플래그를 지정할 수 있다.

다양한 방향으로 JSON 읽기

import pandas as pd

death_causes = pd.read_json('nyc_death_causes.json',
														orient = 'split')
print(death_causes.head())