인생마커
article thumbnail
네이버기반 맛집 분석
인공지능 2021. 7. 14. 22:02

네이버 별점, 방문자리뷰수, 블로그리뷰수, 블로그리뷰 텍스트 총 4가지를 가지고 맛집을 도출해보도록 하겠습니다. 별점, 방문자 리뷰 수 , 블로그 리뷰 수는 셀레니움으로 스크래핑 하고 부산시 소상공인 시장진흥공단_상가에서 상호명과 동이름만남기고 모조리 지우는 전처리를 했습니다. 스크래핑부터 차례대로 시작해봅시다. 한국에서 크롤링이라고 많이 표현을 하는데 스크래핑이 정확한 표현이라고 합니다. 부전 1동 부전 2동에 있는 음식점으로 분류된 가게가 1914개가 존재합니다. 결측값은 없습니다. 처음 네이버 지도 리뷰에서 스크래핑을 시도했습니다. 네이버나 다음이나 블로그던 카페던 본문은 iframe 태그로 이루어져 있는데 스크래핑 작업을 할 때 iframe 소스에서 path 를 따와서 url 에 붙여주는 작업이 ..