如何用Python爬取酷我音樂,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。
成都創(chuàng)新互聯(lián)公司服務(wù)項目包括東鄉(xiāng)網(wǎng)站建設(shè)、東鄉(xiāng)網(wǎng)站制作、東鄉(xiāng)網(wǎng)頁制作以及東鄉(xiāng)網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,東鄉(xiāng)網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到東鄉(xiāng)省份的部分城市,未來相信會繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
前兩天聽了一下酷我音樂官網(wǎng)的音樂,覺得上面的音樂還不錯,想把他們爬取得到。開始,完全沒有頭緒,但是,最后有了實現(xiàn)它的思路,那就是通過兩個json文件最終得到想聽的音樂。
實現(xiàn)這個過程的主要模塊有requests、json、urllib.request、urllib.parse,其中requests模塊用于請求得到相應(yīng)的數(shù)據(jù)(這里是得到j(luò)son數(shù)據(jù)),json模塊用于對得到的json數(shù)據(jù)進(jìn)行處理(將json數(shù)據(jù)轉(zhuǎn)換成字典,主要使用json.loads()方法),urllib.request(使用其urlretrieve()方法,用于下載音樂),urllib.parse(使用其quote()方法,用于對輸入的字符串進(jìn)行編碼)。
首先,我們需要來到酷我音樂的官網(wǎng)(http://www.kuwo.cn/
),在輸入框中輸入關(guān)鍵字,小編輸入的是:破繭
然后回車,可以得到搜索相應(yīng)的歌曲列表,然而這些數(shù)據(jù)都是動態(tài)加載的,使用requests模塊如果直接請求這個網(wǎng)址,根本不可能得到這些數(shù)據(jù),這個時候我們可以按電腦鍵盤F12,來到開發(fā)者模式,點擊Network下面的XHR,找到這些歌曲列表的那個網(wǎng)址,具體為:
我們需要得到這些歌曲中相應(yīng)的數(shù)據(jù)如下:
其中name和artist關(guān)鍵字對應(yīng)的值為展示用和最終.mp3文件名稱,rid關(guān)鍵字對應(yīng)的值是為后面過程所用。
當(dāng)然,訪問這個網(wǎng)址不是很簡單的,需要添加請求頭。參考代碼如下:
musicName=input('請輸入歌曲名稱:')
encodName=quote(musicName)
url='https://www.kuwo.cn/api/www/search/searchMusicBykeyWord?key={}&pn=1&rn=30&httpsStatus=1'.format(encodName)
referer='https://www.kuwo.cn/search/list?key={}'.format(encodName)
# 請求頭
headers = {
"Cookie": "_ga=GA1.2.2021007609.1602479334; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1602479334,1602673632; _gid=GA1.2.168402150.1602673633; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1602673824; kw_token=5LER5W4ZD1C",
"csrf": "5LER5W4ZD1C",
"Referer": "{}".format(referer),
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36",
}
response=requests.get(url=url,headers=headers)
dict2=json.loads(response.text)
misicInfo=dict2['data']['list'] # 歌曲信息的列表
musicNames=list() # 歌曲名稱的列表
rids=list() # 存儲歌曲rid的列表
for i in range(len(misicInfo)):
name=misicInfo[i]['name']+'-'+misicInfo[i]['artist']
musicNames.append(name)
rids.append(misicInfo[i]['rid'])
print('【{}】-{}->>>{}'.format(i+1,int(random.random()*10)*'#$',name))
我們選擇上面列表中歌曲進(jìn)行試聽,可以發(fā)現(xiàn),在剛才那個下面有一個這樣的網(wǎng)址,里面也是一個json數(shù)據(jù),放有我試聽歌曲的下載鏈接。如下:
對這個網(wǎng)址進(jìn)行分析可以得知,需要剛才我們的那個 rid 數(shù)據(jù)才能訪問到相應(yīng)的json數(shù)據(jù)。網(wǎng)址為:http://www.kuwo.cn/url?format=mp3&rid=**140897945**&response=url&type=convert\_url3&br=128kmp3&from=web&t=1603463521198&httpsStatus=1
,也許讀者得到的那個網(wǎng)址長度比我這個長一些,我這個是去掉最后面的那個參數(shù)的,因為我發(fā)現(xiàn)沒有最后的那個參數(shù),依舊可以訪問到相應(yīng)的數(shù)據(jù)。
參考代碼如下:
from urllib.request import urlretrieve
from urllib.parse import quote
import requests
import random
import json
musicName=input('請輸入歌曲名稱:')
encodName=quote(musicName)
url='https://www.kuwo.cn/api/www/search/searchMusicBykeyWord?key={}&pn=1&rn=30&httpsStatus=1'.format(encodName)
referer='https://www.kuwo.cn/search/list?key={}'.format(encodName)
# 請求頭
headers = {
"Cookie": "_ga=GA1.2.2021007609.1602479334; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1602479334,1602673632; _gid=GA1.2.168402150.1602673633; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1602673824; kw_token=5LER5W4ZD1C",
"csrf": "5LER5W4ZD1C",
"Referer": "{}".format(referer),
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36",
}
response=requests.get(url=url,headers=headers)
dict2=json.loads(response.text)
misicInfo=dict2['data']['list'] # 歌曲信息的列表
musicNames=list() # 歌曲名稱的列表
rids=list() # 存儲歌曲rid的列表
for i in range(len(misicInfo)):
name=misicInfo[i]['name']+'-'+misicInfo[i]['artist']
musicNames.append(name)
rids.append(misicInfo[i]['rid'])
print('【{}】-{}->>>{}'.format(i+1,int(random.random()*10)*'#$',name))
id=int(input('請輸入歌曲序號:'))
musicRid=rids[id-1]
url2='https://www.kuwo.cn/url?format=mp3&rid={}&response=url&type=convert_url3&br=128kmp3&from=web&t=1602674521838&httpsStatus=1'.format(musicRid)
headers2={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36"}
response2=requests.get(url=url2,headers=headers2)
dict3=json.loads(response2.text)
downloadUrl=dict3['url']
path=input('請輸入存儲路徑:')
urlretrieve(url=downloadUrl,filename=path+'\{}.mp3'.format(musicNames[id-1])) # 下載歌曲
運行結(jié)果:
找到相應(yīng)的目錄,可以發(fā)現(xiàn)在這個文件夾下面多了一個.mp3文件
首先,小編先聲明一下:本程序參考代碼僅供學(xué)習(xí),切莫用于商業(yè)活動,一經(jīng)被相關(guān)人員發(fā)現(xiàn),本小編概不負(fù)責(zé)!
另外,需要指明的是希望讀者一天不要多次運行本程序代碼,從而減少服務(wù)其負(fù)擔(dān)。
程序代碼或許還有一定的不足!沒有詳細(xì)地分析這兩個網(wǎng)址中的參數(shù),讀者有興趣的話,可以嘗試嘗試。如果讀者覺得小編的這篇文章還不錯!離開的時候別忘了點上一個小小的贊!
看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝您對創(chuàng)新互聯(lián)的支持。
分享名稱:如何用Python爬取酷我音樂
網(wǎng)站路徑:http://sd-ha.com/article26/jicpcg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)頁設(shè)計公司、微信小程序、營銷型網(wǎng)站建設(shè)、網(wǎng)站維護(hù)、網(wǎng)站營銷、網(wǎng)站收錄
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)