日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
黑科技!當會爬蟲的Python遇上會畫圖的FineBI……

 我們平時在用Python爬取網(wǎng)頁上的數(shù)據(jù)時,對爬取到到的數(shù)據(jù)做數(shù)據(jù)分析展現(xiàn)有很多種方式,比如可以通過echart圖表接口、python提供的第三方庫,甚至還可以用matlab工具來進行數(shù)據(jù)統(tǒng)計和圖表可視化展現(xiàn)。

創(chuàng)新互聯(lián)公司專注于虎丘網(wǎng)站建設服務及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供虎丘營銷型網(wǎng)站建設,虎丘網(wǎng)站制作、虎丘網(wǎng)頁設計、虎丘網(wǎng)站官網(wǎng)定制、成都微信小程序服務,打造虎丘網(wǎng)絡公司原創(chuàng)品牌,更為您提供虎丘網(wǎng)站排名全網(wǎng)營銷落地服務。

可無論是以上哪一種方式,都需要通過代碼來調(diào)用Python爬好的數(shù)據(jù)來進行畫圖,圖表樣式屬性設置等方面還是比較繁瑣的。

同樣的問題,有一次小編領(lǐng)導要求我做一份有關(guān)于南京房價的數(shù)據(jù)匯報,需要做到報表里面。數(shù)據(jù)是沒有的,自然而然想到用Python爬,爬好后直接做數(shù)據(jù)圖表粘貼到報表中。但后來發(fā)現(xiàn)方法太土,匯報時不好做動態(tài)的數(shù)據(jù)展現(xiàn)(影響小編炫技裝逼)。于是乎就想辦法,將爬取到的數(shù)據(jù)導入到報表或者BI系統(tǒng)里面,利用BI本身的一些分析功能,聯(lián)動著其他數(shù)據(jù)做展現(xiàn)。于是就有了本篇“Python爬數(shù)據(jù),F(xiàn)ineBI畫圖”的文章。

關(guān)于FineBI

這是一個可視化的自助式BI工具,整個操作就是導數(shù)據(jù)/連數(shù)據(jù)庫——處理數(shù)據(jù)(可視化ETL)選擇圖表——拖數(shù)據(jù)字段——可視化展現(xiàn)&美化,操作簡單上手快。小編只是用了其可視化的一隅功能,多數(shù)情況下,這個工具都是拿來做可視化報表,對接企業(yè)大數(shù)據(jù)平臺,做企業(yè)數(shù)據(jù)運營分析用。

原理介紹

廢話不多說,直接貼出操作。

因為想看看南京房價數(shù)據(jù),但是網(wǎng)站上的很多數(shù)據(jù)都是以HTM5的形式進行呈現(xiàn)的,所以考慮通過Python來進行網(wǎng)頁數(shù)據(jù)抓取和入庫,數(shù)據(jù)分析方面通過FineBI工具直接連接數(shù)據(jù)庫,分析和可視化呈現(xiàn)。

整體的思路:

數(shù)據(jù)層方面先通過Python抓取到WEB端的網(wǎng)頁數(shù)據(jù),之后對爬取到數(shù)據(jù)進行解析再而存儲到MYSQL數(shù)據(jù)入庫;

最后應用層的數(shù)據(jù)處理、數(shù)據(jù)計算統(tǒng)計、圖表可視化呈現(xiàn)等工作全都交由FineBI工具來做。

操作步驟

1.引入相關(guān)python庫包

首先新建python工程,引入本次爬取網(wǎng)頁數(shù)據(jù)和寫入MySQL數(shù)據(jù)庫所需要的requests、pymysql、bs4這三個包:

2.獲取網(wǎng)頁數(shù)據(jù)

然后如下圖所示,通過編寫Python代碼獲取到某一個房產(chǎn)網(wǎng)頁的南京售房平臺的網(wǎng)頁信息:

3.HTML標簽解析

接著再對DIV樣式下的HTML數(shù)據(jù)包進行逐一解析,獲取到想要的房源名稱、地址、小區(qū)、戶型、面積、總價、單價、區(qū)域等數(shù)據(jù):

其中對應網(wǎng)頁的標簽樣式可以通過瀏覽器的F12開發(fā)選項進行快速獲取,如下圖所示的定位房源信息截圖,我們只需要右鍵瀏覽器在所需要獲取標簽樣式名稱的地方點擊檢查元素即可(房源名稱的標簽即位house-title的title元素)。

4.MySQL數(shù)據(jù)回寫

解析好數(shù)據(jù)之后,再將解析好的數(shù)據(jù)寫入到MySQL數(shù)據(jù)庫中:

循環(huán)遍歷該平臺在南京最近七天的網(wǎng)頁售房信息數(shù)據(jù),頁面17頁,共計377條數(shù)據(jù):

5.安裝FineBI&&驗證數(shù)據(jù)入庫

通過FineBI官網(wǎng)下載并按照引導安裝好軟件:

直接通過FineBI提供的數(shù)據(jù)配置端的功能,添加SQL數(shù)據(jù)集(或者直接添加表也行),查看和驗證剛剛爬取并且入庫的數(shù)據(jù)是否已經(jīng)真正成功入庫到MySQL中了。

如下圖所示,Python果然不辱使命,我要的該平臺的七天南京的房價售房數(shù)據(jù)都已經(jīng)成功寫入到了我的MySQL數(shù)據(jù)庫中了。

6.FineBI可視化制作&成果展示

然后思考需要分析展現(xiàn)哪些內(nèi)容,比如“南京各小區(qū)房價分布”、“房型價格分析”、“各區(qū)域房價分析”.....通過FineBI制作圖表展現(xiàn)。

下面這個動圖展示了一個圖表的制作,其他都類似的,可參考。不懂可參見FineBI官網(wǎng)的幫助文檔。

花了十分鐘,就將我想要看的南京售房信息(房源面積均價、套房總均價、小區(qū)房價四象限分布圖、區(qū)域房價分析、房型價格分析)以可視化的形式呈現(xiàn)出來了。

最后就是本次成果展示啦,也曬出來跟大家分享下,如下所示:

1.目前南京房源均價為3.78萬每平方米,總均價為401.38萬,總體上還是比較高的。

2.建鄴區(qū)房價最高,果然房價還是緊跟國家政策啊,建鄴目前城區(qū)開發(fā)建設政府的扶持力度在南京都是走在前面的。鼓樓、玄武、秦淮分別排在二、三、四的位置,雨花臺和江寧房價相對較低,綜合市區(qū)位置來看,還是秦淮區(qū)性價比最高啊 。

3.房型方面,6室3廳的豪華大宅總均價接近一千萬,比如紫檀雅居、碧水灣別墅、濱江奧城聽雨苑這一類土豪小區(qū),多集中在建鄴和鼓樓區(qū)域;一室一廳的房子均價大概在150萬的樣子,比如托樂嘉單身公寓、經(jīng)緯城市花園等小區(qū),適合單身貴族或者情侶小夫婦居住,南京各個大區(qū)都有;比較主流的三室一廳房價在300萬左右,比如喬虹苑小區(qū)、良辰美景家園、白云園,多集中在秦淮和鼓樓區(qū)域。

后記

Python完成對網(wǎng)頁數(shù)據(jù)的抓取和解析存儲之后,配合FineBI強大的數(shù)據(jù)可視化呈現(xiàn)能力則圓滿地完成了本次對南京售房數(shù)據(jù)的統(tǒng)計和分析需求,絕對推薦!


標題名稱:黑科技!當會爬蟲的Python遇上會畫圖的FineBI……
本文網(wǎng)址:http://www.5511xx.com/article/djdpjdj.html