앎을 경계하기

DAFIT 58

<DAFIT> 07 OpenCV 다루기 첫걸음 - 05 영상 뒤집기

이번에는 flip을 해보는 문제이다. import cv2 from google.colab.patches import cv2_imshow import numpy as np img_path = '/content/drive/My Drive/다핏문제/907/lena.jpg' flip함수는 사용하는 게 굉장히 쉽다. 1이면 좌우반전, 0이면 상하반전을 한다. img = cv2.imread(img_path,1) print('origin') cv2_imshow(img) v_img = cv2.flip(img, 1) print('\n\nvertical flip') cv2_imshow(v_img) h_img = cv2.flip(img, 0) print('\n\nhorizontal flip') cv2_imshow..

<DAFIT> 07 OpenCV 다루기 첫걸음 - 04 영상 회전

지난번 translation에 이어 이번에는 rotation을 해보는 문제이다. import cv2 import numpy as np from google.colab.patches import cv2_imshow img_path = '/content/drive/My Drive/다핏문제/907/lena.jpg' angle을 지정해서 cv2.getRotationMatrix2D()를 사용해서 이미지의 중심점, 회전할 각도, 이미지크기(scale)을 넣어서 matrix를 구성해서 warpAffine에 넣어주면 된다. img = cv2.imread(img_path,1) rows, cols = img.shape[:2] angle = 90.0 M = cv2.getRotationMatrix2D((cols/2..

<DAFIT> 07 OpenCV 다루기 첫걸음 - 03 영상 이동

사진을 이동시켜보는 문제이다. import cv2 import numpy as np from google.colab.patches import cv2_imshow img_path = '/content/drive/My Drive/다핏문제/907/lena.jpg' x축으로 50 ( 1, 0, 50 ), y축으로 50 ( 0, 1, 50 ) 이동해보자. img = cv2.imread(img_path,1) rows, cols = img.shape[:2] M = np.float32([[1,0,50],[0,1,50]]) img_result = cv2.warpAffine(img, M, (cols, rows)) cv2_imshow(img_result) 굉장히 쉽게 성공했다! http://www.dafit.m..

<DAFIT> 07 OpenCV 다루기 첫걸음 - 02 영상 읽기, 출력, 저장

이번에는 이미지의 채널을 변환하고 분리하고 병합하는 것이다. import cv2 as cv from google.colab.patches import cv2_imshow img_path = '/content/drive/My Drive/다핏문제/907/lena.jpg' * 채널 변환 # OpenCV의 삼원색 기본 순서는 BGR이다. img_bgr = cv.imread(img_path,1) img_rgb = cv.cvtColor(img_rgb, cv.COLOR_BGR2RGB) cv2_imshow(img_bgr) cv2_imshow(img_rgb) * 채널 분리 및 병합 b,g,r = cv.split(img_bgr) img_rbg = cv.merge((r,b,g)) cv2_imshow(img_rbg..

<DAFIT> 07 OpenCV 다루기 첫걸음 - 01 영상 읽기, 출력, 저장

이번 OpenCV 문제들은 lena 사진을 가지고 문제를 진행한다. 레나 이미지는 영상처리를 접해본 적 있다면 한번쯤 어디선가 다 봤을 것 같다. 코랩에서 진행해서 imshow()를 사용하려면 아래 import 과정이 필요하다. import cv2 as cv from google.colab.patches import cv2_imshow img_path = '/content/drive/My Drive/다핏문제/907/DF907_01_01.jpg' #3채널로 이미지 읽기 img3 = cv.imread(img_path, flags=1) imread(이미지 경로, flags=-1,0,1 또는 enum constant) 1 = color 0 = grayscale -1 = alpha 채널 포함 열거형 상..

<DAFIT> 06 머신러닝을 통한 당뇨병 예측 - 07 Feature Importance

지금까지 풀었던 문제를 다시 한 번 정리해볼 수 있는 시간이다. from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split import pandas as pd 지난 번 예측문제에서 사용했던 의사결정트리와 랜덤포레스트를 다시 한 번 사용한다. 데이터를 로드하고, data = pd.read_csv("/content/drive/My Drive/다핏문제/906/dataset_37_diabetes.csv") data 결측치 처리한다. presd = data.replace({'pres':0},..

<DAFIT> 06 머신러닝을 통한 당뇨병 예측 - 06 Random Forest를 이용한 당뇨병 예측

지난번엔 Decision Tree였다면 이번에는 Random Forest이다. 랜덤 포레스트는 앙상블 방법 중 하나로 여러개의 의사결정트리가 모여서 classification이나 regression 문제를 푼다. sklearn.ensemble 내 RandomForestClassifier를 제공하고있다. from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split import pandas as pd data = pd.read_csv("/content/drive/My Drive/다핏문제/906/dataset_37_diabetes.csv") data #데이터 결측치 처리와 ..

<DAFIT> 06 머신러닝을 통한 당뇨병 예측 - 05 Decision Tree를 이용한 당뇨병 예측

의사결정트리(Decision Tree)는 여러 분류 규칙을 적용하여 분류문제 또는 회귀문제에 적용할 수 있는 분류 모형이다. 아래 그림과 같이 트리 구조로 되어있는 분류 규칙을 따라서 classification 할 수 있다. scikit-learn에서 쉽게 decision tree를 사용할 수 있도록 제공하고 있다. from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split import pandas as pd import numpy as np 필요 패키지들 임포트해주고, data = pd.read_csv("/content/drive/My Drive/다핏문제/906/datas..

<DAFIT> 06 머신러닝을 통한 당뇨병 예측 - 04 데이터 분할

이번 문제는 본격적으로 데이터 셋을 만드는 문제이다. 학습데이터셋, 검증데이터셋, 테스트데이터셋으로 나누면 되는 문제. 사실 train validation test ratio만 검색해도 어떤 비율로 데이터를 나눠야하는 지 많이 나온다. 주로 train/test만 사용할때는 70/30 비율로 사용하고 train/validation/test는 60/20/20으로 사용한다. scikit-learn에서 제공하는 메소드를 사용하면 쉽게 데이터셋을 분리할 수 있다. train_test_split(x,y,test_size=0.25,random_state=1) 이런식으로 사용하면 된다. https://scikit-learn.org/stable/modules/generated/sklearn.model_selection...

<DAFIT> 06 머신러닝을 통한 당뇨병 예측 - 03 데이터 시각화

이번에는 data visualization 문제! 대학원 강의 중 visualization 관련 수업을 들은 적이 있어서 그런지 가장 편하게 접근할 수 있었던 문제였다. 1,2번 문제를 푼면서 데이터를 볼 때 불편했던 점들을 추려보니.. 1. 값이 전체적으로 어떤 범위 내에 위치하는지 모른다. 2. 이상치가 한 눈에 보이지 않는다. 3. 피쳐마다의 데이터가 어떻게 분포하고 있는지 보고싶다. 4. 내가 결측치 대체 방안으로 사용했던 median과 mean의 차이가 어느정도 나는지 알고 싶다. 이 정도로 말할 수 있을 것 같다. 그래서 나는 각 feature마다 boxplot을 사용해서 데이터를 시각화하였다. boxplot은 다음과 같이 생겼다. 상자수염그림라고도 하는데 왜 수염상자냐면 저 박스 위아래로 길..