주제 데이터를 저장소에서 추출하는 방법에 대해 배웠다. 데이터 추출 데이터 처리에 적합하지 않은 영구 저장소의 데이터를 메모리로 추출하는 작업 영구 저장소 : Amazon S3 file, SQL Database 등 텍스트 파일에서 데이터 추출하기 비정형화된 일반적인 텍스트 파일 행 = 레코드, 열 = 속성인 플랫 파일 csv, tsv 파일 JSON 반정형 데이터 4개의 원자 데이터 타입 - 숫자, 문자열, 부울, 널 복합 데이터 유형 - 배열, 객체 Python의 dictionary와 매핑이 잘 된다. JSON은 웹 서비스에서 많이 사용된다. 웹에서의 데이터 추출 일반적으로 웹 브라우저에서 google을 검색하면 브라우저는 google 홈페이지 컨텐츠를 "요청"한다. google 서버는 페이지를 구성하는..