앎을 경계하기

파이썬 34

Visualization - matplotlib histogram

히스토그램은 데이터를 파악하기 위해 매우 유용한 시각화 방법이다. 예시를 들어 정리하는 것이 편하다. 10명의 키를 조사한 결과가 아래와 같다. 사람 키 1 180 2 175 3 155 4 160 5 161 6 178 7 188 8 182 9 163 10 172 151~160, 161~170, 171~180, 181~190 범위로 데이터를 표현하고 싶을 때 히스토그램이 적절하다. 히스토그램의 "bin"은 데이터를 담을 바구니 수라고 생각하면 편하다. 그렇다면, y축은 각 바구니에 담긴 데이터의 수라고 할 수 있다. 위 예시에서는 bins = 4가 될것이다. heights = [180,175,155,160,161,178,188,182,163,172] plt.hist(heights, bins=4, edgec..

Data Science 2021.08.28

Visualization - matplotlib line chart, scatter chart

자주 사용하지만 블로그에 따로 정리해놓지 않아서 이번 데이터캠프 컨텐츠를 이용하기는 김에 정리해야겠다. 시각화를 하는 이유? - 데이터 분석을 위해 시각화가 필요하다. - 데이터 탐색을 위해 사용한다. - 새로운 Insight를 찾아 다른 사람들과 공유한다. matplotlib 사용해보기 import matplotlib.pyplot as plt year = [1998, 1999, 2000, 2001] pop = [8.19, 10.08, 12.54, 16.88] plt.plot(year, pop) plt.show() plot(x축, y축)을 하게 되면 다음과 같이 꺾은 선 그래프가 나온다. import matplotlib.pyplot as plt year = [1998, 1999, 2000, 2001] p..

Data Science 2021.08.28

FLASK 4 - 웹 크롤링 구글검색결과 웹 페이지에 표시하기

웹 크롤링을 하기 전, 필요한 라이브러리에 대해 설명한다.requests파이썬에서 HTTP 요청을 보내는 모듈이다.BeautifulSoupHTML과 XML 문서를 파싱하기 위해 사용하는 파이썬 패키지페이지에 대한 구문 분석 트리를 제공한다. 위 두 가지 라이브러리를 사용하여 구글 검색 결과를 가져와보자.google_keyword.pyimport requests from bs4 import BeautifulSoup def get_search_count(keyword): url = "https://www.google.com/search?q={}".format(keyword) headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWeb..

Programming/Python 2020.12.21

FLASK 3 - get, post 분기 생성/클라이언트에서 서버로 데이터 전송

웹 페이지에서 로그인을 하는 경우와 같이 사용자가 어떠한 입력을 통해 서버에 데이터를 전송해야하는 경우가 있다.이 때 GET과 POST 방식으로 데이터를 받는다. 학부 때 통신 수업에서 배웠던 기억을 되살리면... GET은 데이터가 전부 오픈된다는것이고 POST는 GET보다는 보안측면에서 안전하다는것..? 정도 기억난다. (포스팅 후 찾아봐야지)접속 URL을 정하는 어노테이터의 파라미터인 methods에 사용할 방식을 지정해준다.app.py@app.route("/", methods=["GET", "POST"]) # 접속 urldef index(): if request.method == "POST": # 요청 방식이 POST라면, print(request.form.get("user")) # 안전하게 가져오..

Programming/Python 2020.12.17

파이썬 데이터분석 실무 테크닉 100 - 1장

파이썬 데이터 분석 실무 테크닉 100은 주어진 데이터에 적용할 여러 라이브러리의 함수 사용법을 설명하는 책들과 달리, 실무에서 데이터가 주어졌을 때 가장 먼저 해야할 일과 이후 순차적으로 분석방법에 대해 설명한다. 01장 웹에서 주문수를 분석하는 테크닉 10¶ 목표 : 어떤 기업 쇼핑몰 사이트의 상품 주문 수의 추세를 분석하여 판매량 개선의 방향 찾기. 쇼핑몰 사이트는 비교적 깨끗한 데이터인 경우가 많다. 쇼핑몰 사이트는 매출 추세뿐만 아니라 언제, 누가 구입했는지 등, 상세 데이터가 많을 수록 깊게 분석이 가능하다. 그러나 현장에서 데이터를 관리할 때, 한 곳에서 관리되지 않는 것이 일반적이다. 이러한 경우 데이터를 연결하는 작업이 필요할 때도 있다. 전제조건¶ 쇼핑몰 사이트의 데이터를 다룬다. 주요..