日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
Python微博移動端爬蟲實例(附代碼)

本文簡要講述用Python爬取微博移動端數(shù)據(jù)的方法。可以看一下Robots協(xié)議。另外盡量不要爬取太快。如果你毫無節(jié)制的去爬取別人數(shù)據(jù),別人網(wǎng)站當(dāng)然會反爬越來越嚴厲。至于為什么不爬PC端,原因是移動端較簡單,很適合爬蟲新手入門。有時間再寫PC端吧!

環(huán)境介紹

Python3/Windows-10-64位/微博移動端

網(wǎng)頁分析

以獲取評論信息為例(你可以以自己的喜好獲得其他數(shù)據(jù))。如下圖:

在這里就會涉及到一個動態(tài)加載的概念,也就是我們只有向下滑動鼠標滾輪才會加載出更多的評論數(shù)據(jù)。這也是網(wǎng)頁經(jīng)常使用的方式。接下來就應(yīng)該找到評論信息的真實網(wǎng)址,找到真實網(wǎng)址的方法就是打開瀏覽器的開發(fā)者工具,火狐/谷歌是F12鍵。打開如下:

打開以后點擊網(wǎng)絡(luò),網(wǎng)絡(luò)用來記錄瀏覽器和服務(wù)器交換的信息。接下來將鼠標滾輪緩慢向下滾動,在這個過程中就會彈出類似于上圖的信息,也就是評論信息加載出來了。找到評論信息,應(yīng)該會在***條。如下圖:

真實網(wǎng)址:https://m.weibo.cn/api/comments/show?id=4160547165300149&page=3

將網(wǎng)址在火狐里面打開如下圖:

上面的網(wǎng)址其實pages=3就代表第三頁,所以只需模擬網(wǎng)址即可,pages=4,5,6。。。。

另外由于是Json文件,所以提取數(shù)據(jù)非常方便,只需用切片操作即可。


文章名稱:Python微博移動端爬蟲實例(附代碼)
瀏覽路徑:http://www.5511xx.com/article/dpcodpc.html