Web Crawler for NLP (1)
데이터 가공
1 | from selenium import webdriver |
1 | from selenium import webdriver |
웹 브라우저와 웹 서버는 HTTP라는 통신규약(
프로토콜
)을 사용해서 통신한다.
브라우저에서 서버로 요청(request
), 서버에서 브라우저로 응답(response
)할 때 어떻게 할지를 나타낸 규약이다.
무상태(stateless
) HTTP 통신
으로는 회원제 사이트를 만들 수 없다.(stateless
: 이전에 어떤 데이터를 가져갔는지 등에 대한 정보(상태 : state
)를 전혀 저장하지 않는 통신)
방문하는 사람의 컴퓨터에 일시적으로 데이터를 저장하는 기능
하지만 1개의 쿠키
엔 4096byte
의 데이터 크기 제한이 있다.
또한 쿠키
는 HTTP 통신
헤더를 통해 읽고 쓸 수 있다. 따라서 방문자 혹은 확인자가 원하는 대로 변경할 수 있다.
하지만 위의 말대로 쉽게 변경이 가능하기에 비밀번호 등의 비밀 정보는 세션
을 통해 다뤄진다.새션
도 쿠키
를 사용해 데이터를 저장하는 점은 같다. 하지만, 방문자 고유 ID만을 저장하고, 실제로 모든 데이터는 웹 서버에 저장하므로 쿠키
와는 다르게 저장할 수 있는 데이터에 제한이 없다.