웹크롤링(web crawling) 입문,기본
WEB
2021. 5. 3. 09:35
파이썬을 이용해 크롤링을 하는 이유? : 코드작성이 쉬워서(읽고 사용하기 편리함) : 비동기식 코딩방식(=인터프리터언어) >> 작성한 코드를 한줄한줄 실행시키는 것. 빅데이터 : 5V >> Volumn, Velocity, Variety, Veracity(정확성), Value : 디지털 환경에서 생성되는 수치, 문자, 이미지, 영상을 모두 포함하는 데이터. 데이터의 형태 >> 정형: 데이터베이스, 엑셀, CSV, 연산이 가능한 데이터 >> 반정형: HTML 문서와 같은, 어떤 패턴이나 규칙은 존재하지만 연산이 불가능함 >> 비정형: SNS, 음악, 이미지같은 파일의 특정 형식이 없는 데이터 웹 기초지식 request와 response가 존재함. 접근할 웹 페이지의 데이터를 요청, 응답받기 위해 사용하는 함..