중화사전망 - 서예자전 - 파이썬을 사용하여 넷이즈 클라우드 뮤직 핫 리뷰를 캡처하는 방법
파이썬을 사용하여 넷이즈 클라우드 뮤직 핫 리뷰를 캡처하는 방법
순서
최근 줄곧 텍스트 발굴과 관련된 내용을 연구하고 있다. 이른바 교부란 쌀이 없는 밥을 짓기 어렵다. 텍스트를 분석하려면 먼저 텍스트를 가져와야 합니다. 인터넷에서 기성품 텍스트 문서를 다운로드하거나 타사 제공 API 를 통해 데이터를 얻는 등 여러 가지 방법으로 텍스트를 얻을 수 있습니다. 그러나 때로는 직접 다운로드 채널이나 API 가 없기 때문에 원하는 데이터를 직접 얻을 수 없는 경우도 있습니다. 그럼 이번에는 어떻게 해야 할까요? 웹 파충류를 통해 원하는 데이터를 얻는 또 다른 더 좋은 방법은 컴퓨터 프로그램을 작성하여 사용자로 위장하는 것이다. 컴퓨터의 효율성이 높아짐에 따라, 우리는 빠르고 편리하게 데이터를 얻을 수 있다.
파충류 정보
그럼 파충류는 어떻게 쓰나요? 파충류를 쓸 수 있는 언어는 자바, PHP, 파이썬 등이다. 개인은 파이썬을 비교적 좋아한다. 파이썬은 강력한 내장 웹 라이브러리뿐만 아니라 훌륭한 타사 라이브러리도 많이 가지고 있기 때문에 다른 사람이 직접 바퀴를 만들어 가지고 있으면 됩니다. 이것은 파충류를 쓰는 데 큰 편리함을 가져다 줍니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 스포츠명언) 사실 10 줄 파이썬 코드로 작은 파충류를 작성할 수 없고, 다른 언어로 많은 코드를 작성할 수 있다는 것은 과장이 아닙니다. 간단하고 이해하기 쉬운 것은 파이썬의 큰 장점이다.
좋아, 일이 늦어서는 안 돼, 우리는 오늘 본론으로 들어갈게. 최근 몇 년 동안 넷이즈 클라우드 뮤직 유행이 시작되었다. 저는 넷이즈 클라우드 뮤직 사용자입니다. 몇 년이 걸렸습니다. 예전에는 QQ 음악과 쿨한 개를 사용했다. 내 자신의 경험으로 볼 때, 나는 넷이즈 클라우드 뮤직 최대의 특징은 정확한 노래 추천과 독특한 사용자 평론이라고 생각한다. (엄숙한 선언! ! ! 이것은 소프트 텍스트가 아니라 광고입니다! ! ! 개인의 관점만을 대표할 뿐, 뿌리지 마라! ) 을 참조하십시오. 종종 어떤 신의 평론은 한 곡 아래에서 많이 짱 된다. 한편, 넷이즈 클라우드 뮤직 며칠 전 정선된 사용자 댓글을 지하철로 옮겼고, 넷이즈 클라우드 뮤직 댓글이 또 불붙었다. 그래서 왕이윈 리뷰를 분석하고, 법칙을 찾아내고, 특히 일부 열평의 특징을 분석하고 싶다. 이 목표를 안고, 나는 왕이윈 리뷰를 잡기 시작했다.
인터넷 도서관
Python 에는 urllib 와 urllib2 라는 두 개의 내장 네트워크 라이브러리가 있습니다. 하지만 이 두 라이브러리는 모두 사용하기에 편리하지 않습니다. 그래서 여기서는 호평을 받고 있는 제 3 자 라이브러리인 requests 를 사용합니다. 요청을 사용하면 몇 줄의 코드만 있으면 에이전트, 시뮬레이션 로그인 및 기타 복잡한 파충류 작업을 설정할 수 있습니다. Pip 가 이미 설치되어 있는 경우 pip 설치 요청을 사용하여 직접 설치할 수 있습니다.
중국어 문서의 주소는 here = (organic) | ut mcmd = organic; Playerid = 81568911; _ _ utmb = 94650624.23.10.1490672820 ",
연결':' 활성 유지' ,
인용자':/'}
# 프록시 서버 설정
프록시 = {
요소 (URL):
Hot_comments_list = []
Hot_comments_list.append(u "사용자 ID 사용자 별명 사용자 아바타 주소 댓글 시간 총 댓글 내용 좋아")
Params = get_params( 1) # 페이지 1 페이지
EncSecKey = get_encSecKey ()
Json_text = get_json(url, params, encSecKey)
Json_dict = json.loads(json_text)
Hot _ comments = JSON _ dict ['핫 리뷰'] # 핫 리뷰
인쇄 ("* * * 에 %d 개의 핫 리뷰가 있습니다!" " % len (핫 리뷰))
많이 사용되는 의견 항목:
Comment = item['content'] # 설명 내용
LikedCount = item['likedCount'] # 총 좋아하는 수
Comment_time = item['time'] # 주석 시간 (타임스탬프)
UserID = item[' 사용자'] ['사용자 ID'] # 평가자 ID
별명 = 항목 ['사용자'] ['별명'] # 별명
아바타' 주소 = 프로젝트 ['사용자'] ['아바타 주소'] # 아바타 주소
Comment_info = userID+""+별명+""+avatar URL+""+comment _ time+""+liked count+
Hot _ comments _ list.append (comment _ info)
핫 의견 목록으로 돌아가기
# 노래에 대한 모든 코멘트 캡처
모든 설명 가져오기 (URL) 정의:
All_comments_list = [] # 모든 의견을 저장합니다.
All_comments_list.append(u "사용자 ID 사용자 별명 사용자 아바타 주소 댓글 시간 총 댓글 내용 좋아) # 헤더 정보
Params = get_params( 1)
EncSecKey = get_encSecKey ()
Json_text = get_json(url, params, encSecKey)
Json_dict = json.loads(json_text)
Comments _ num = int (JSON _ dict ['total'])
If(comments_num% 20 == 0):
- 관련 기사
- 급해서 머리가 급선회하고 답이 있다.
- 천란의 건너편' 을 읽는 소감: 소중히 여기고, 잃을 때까지 기다리지 마라.
- 차를 인도하는 이런 고장의 보편적인 문제는 무엇입니까? 16825.
- 스펀지 아기는 어떻게 귀여운 그림을 그리나요?
- 급해요! 현재 지식대회에는 15 가 필요합니다. 문제당 최소 두 개의 공백문제가 있습니다. 난이도가 중간 이상이며 천문학, 지리, 군사, 인문, 상식을 포함합니다.
- 왕희지에 관한 작은 이야기
- "촛불 아래 진 퇴교사" 의 원문과 번역문
- 4 비트 문자 인코딩의 최대값은 a,32b, 3 1 C, 16 D, 15 입니다.
- 어떻게 좋은 독서 습관을 키울 수 있습니까?
- 형성자는 어느 면과 어느 면으로 구성되어 있습니까?