주제
데이터프레임 합치는 방법에 대해 배웠다.
여러 개의 데이터프레임 합치기
append()함수를 사용해서 두 데이터프레임을 합칠 수 있다.- 인덱스의 중복 문제를 해결하기 위해
ignore_index=True를 설정하여 다시 인덱스를 매기도록 한다.
params = {'term' : 'bookstore', 'location' : 'San Francisco'} first_results = requests.get(api_url, headers=headerws, params=params).json() first_20_bookstores = json_normalize(first_results['businesses'],sep='_') print(first_20_bookstores.shape)
Yelp API는 한 번에 20개의 레코드를 반환한다.(20, 24)params['offset'] = 20 next_results = requests.get(api_url, headers=headers, params=params).json() next_20_bookstores = json_normalize(next_results['businesses'], sep='_') print(next_20_bookstores.shape)(20, 24)first_20_bookstores에next_20_bookstores를 추가하고 행 인덱스를 다시 지정한다.
- 인덱스의 중복 문제를 해결하기 위해
bookstores = first_20_bookstores.append(next_20_bookstores, ignore_index=True)- 다음 20개의 레코드를 가져오기 위해 오프셋을 사용한다.
병합
컬럼을 사용해서 두 데이터프레임을 병합한다.
지난 SQL JOIN과 같은 형태이다.
merge()를 사용해서 합칠 수 있다.on에 두 데이터프레임의 공통 컬럼을 명시한다.- 만약 컬럼 이름이 다르다면
left_on,right_on을 사용하면 된다.
- 병합이 제대로 되려면 컬럼의 타입이 동일해야한다.
- 만약 컬럼 이름이 다르다면
Uploaded by Notion2Tistory v1.1.0