중화사전망 - 서예자전 - 파이썬을 사용하여 넷이즈 클라우드 뮤직 핫 리뷰를 캡처하는 방법

파이썬을 사용하여 넷이즈 클라우드 뮤직 핫 리뷰를 캡처하는 방법

이 글에서 공유하는 내용은 어떻게 Python 으로 넷이즈 클라우드 뮤직 등반에 대한 뜨거운 논평이며, 일정한 참고가치가 있고, 필요한 친구가 참고할 수 있다.

순서

최근 줄곧 텍스트 발굴과 관련된 내용을 연구하고 있다. 이른바 교부란 쌀이 없는 밥을 짓기 어렵다. 텍스트를 분석하려면 먼저 텍스트를 가져와야 합니다. 인터넷에서 기성품 텍스트 문서를 다운로드하거나 타사 제공 API 를 통해 데이터를 얻는 등 여러 가지 방법으로 텍스트를 얻을 수 있습니다. 그러나 때로는 직접 다운로드 채널이나 API 가 없기 때문에 원하는 데이터를 직접 얻을 수 없는 경우도 있습니다. 그럼 이번에는 어떻게 해야 할까요? 웹 파충류를 통해 원하는 데이터를 얻는 또 다른 더 좋은 방법은 컴퓨터 프로그램을 작성하여 사용자로 위장하는 것이다. 컴퓨터의 효율성이 높아짐에 따라, 우리는 빠르고 편리하게 데이터를 얻을 수 있다.

파충류 정보

그럼 파충류는 어떻게 쓰나요? 파충류를 쓸 수 있는 언어는 자바, PHP, 파이썬 등이다. 개인은 파이썬을 비교적 좋아한다. 파이썬은 강력한 내장 웹 라이브러리뿐만 아니라 훌륭한 타사 라이브러리도 많이 가지고 있기 때문에 다른 사람이 직접 바퀴를 만들어 가지고 있으면 됩니다. 이것은 파충류를 쓰는 데 큰 편리함을 가져다 줍니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 스포츠명언) 사실 10 줄 파이썬 코드로 작은 파충류를 작성할 수 없고, 다른 언어로 많은 코드를 작성할 수 있다는 것은 과장이 아닙니다. 간단하고 이해하기 쉬운 것은 파이썬의 큰 장점이다.

좋아, 일이 늦어서는 안 돼, 우리는 오늘 본론으로 들어갈게. 최근 몇 년 동안 넷이즈 클라우드 뮤직 유행이 시작되었다. 저는 넷이즈 클라우드 뮤직 사용자입니다. 몇 년이 걸렸습니다. 예전에는 QQ 음악과 쿨한 개를 사용했다. 내 자신의 경험으로 볼 때, 나는 넷이즈 클라우드 뮤직 최대의 특징은 정확한 노래 추천과 독특한 사용자 평론이라고 생각한다. (엄숙한 선언! ! ! 이것은 소프트 텍스트가 아니라 광고입니다! ! ! 개인의 관점만을 대표할 뿐, 뿌리지 마라! ) 을 참조하십시오. 종종 어떤 신의 평론은 한 곡 아래에서 많이 짱 된다. 한편, 넷이즈 클라우드 뮤직 며칠 전 정선된 사용자 댓글을 지하철로 옮겼고, 넷이즈 클라우드 뮤직 댓글이 또 불붙었다. 그래서 왕이윈 리뷰를 분석하고, 법칙을 찾아내고, 특히 일부 열평의 특징을 분석하고 싶다. 이 목표를 안고, 나는 왕이윈 리뷰를 잡기 시작했다.

인터넷 도서관

Python 에는 urllib 와 urllib2 라는 두 개의 내장 네트워크 라이브러리가 있습니다. 하지만 이 두 라이브러리는 모두 사용하기에 편리하지 않습니다. 그래서 여기서는 호평을 받고 있는 제 3 자 라이브러리인 requests 를 사용합니다. 요청을 사용하면 몇 줄의 코드만 있으면 에이전트, 시뮬레이션 로그인 및 기타 복잡한 파충류 작업을 설정할 수 있습니다. Pip 가 이미 설치되어 있는 경우 pip 설치 요청을 사용하여 직접 설치할 수 있습니다.

중국어 문서의 주소는 here = (organic) | ut mcmd = organic; Playerid = 81568911; _ _ utmb = 94650624.23.10.1490672820 ",

연결':' 활성 유지' ,

인용자':/'}

# 프록시 서버 설정

프록시 = {

요소 (URL):

Hot_comments_list = []

Hot_comments_list.append(u "사용자 ID 사용자 별명 사용자 아바타 주소 댓글 시간 총 댓글 내용 좋아")

Params = get_params( 1) # 페이지 1 페이지

EncSecKey = get_encSecKey ()

Json_text = get_json(url, params, encSecKey)

Json_dict = json.loads(json_text)

Hot _ comments = JSON _ dict ['핫 리뷰'] # 핫 리뷰

인쇄 ("* * * 에 %d 개의 핫 리뷰가 있습니다!" " % len (핫 리뷰))

많이 사용되는 의견 항목:

Comment = item['content'] # 설명 내용

LikedCount = item['likedCount'] # 총 좋아하는 수

Comment_time = item['time'] # 주석 시간 (타임스탬프)

UserID = item[' 사용자'] ['사용자 ID'] # 평가자 ID

별명 = 항목 ['사용자'] ['별명'] # 별명

아바타' 주소 = 프로젝트 ['사용자'] ['아바타 주소'] # 아바타 주소

Comment_info = userID+""+별명+""+avatar URL+""+comment _ time+""+liked count+

Hot _ comments _ list.append (comment _ info)

핫 의견 목록으로 돌아가기

# 노래에 대한 모든 코멘트 캡처

모든 설명 가져오기 (URL) 정의:

All_comments_list = [] # 모든 의견을 저장합니다.

All_comments_list.append(u "사용자 ID 사용자 별명 사용자 아바타 주소 댓글 시간 총 댓글 내용 좋아) # 헤더 정보

Params = get_params( 1)

EncSecKey = get_encSecKey ()

Json_text = get_json(url, params, encSecKey)

Json_dict = json.loads(json_text)

Comments _ num = int (JSON _ dict ['total'])

If(comments_num% 20 == 0):