인생마커
article thumbnail
(ML/DL)Heart Attack 예측 모델
인공지능 2021. 7. 26. 00:01

Heart Attack Analysis & Prediction Dataset A dataset for heart attack classification www.kaggle.com Kaggle 데이터셋으로 Traditional Machine Learning 과 Deep Learning을 진행했습니다. Heart Attack Analysis dataset은 의료분야에서 인공지능이 활발하게 이용되기도 하고 Kaggle에 양질의 데이터가 많습니다. 다만, 이번에 사용한 데이터 갯수는 300개 정도입니다. 모델을 학습시키기에 현저히 적은 데이터 갯수지만 많은 데이터로 진행을 한다고 해서 맥락이 바뀌진 않습니다. 전체적으로 Google Colab에서 진행했습니다. 훈련 data에 대한 feature 수는 총 13개..

article thumbnail
네이버기반 맛집 분석
인공지능 2021. 7. 14. 22:02

네이버 별점, 방문자리뷰수, 블로그리뷰수, 블로그리뷰 텍스트 총 4가지를 가지고 맛집을 도출해보도록 하겠습니다. 별점, 방문자 리뷰 수 , 블로그 리뷰 수는 셀레니움으로 스크래핑 하고 부산시 소상공인 시장진흥공단_상가에서 상호명과 동이름만남기고 모조리 지우는 전처리를 했습니다. 스크래핑부터 차례대로 시작해봅시다. 한국에서 크롤링이라고 많이 표현을 하는데 스크래핑이 정확한 표현이라고 합니다. 부전 1동 부전 2동에 있는 음식점으로 분류된 가게가 1914개가 존재합니다. 결측값은 없습니다. 처음 네이버 지도 리뷰에서 스크래핑을 시도했습니다. 네이버나 다음이나 블로그던 카페던 본문은 iframe 태그로 이루어져 있는데 스크래핑 작업을 할 때 iframe 소스에서 path 를 따와서 url 에 붙여주는 작업이 ..

article thumbnail
타이타닉 생존자 예측, 머신러닝(feat.sklearn)
인공지능 2021. 7. 5. 21:44

라이브러리 및 데이터 가져오기 import warnings warnings.filterwarnings("ignore") import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import LabelEncoder from sklearn import datasets, model_selection, linear_model, ensemble,neighbors from sklearn.metrics import mean_squared_error,accuracy_score from sklearn.model_selection import train_test_split from sklearn.svm i..