日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
6個優(yōu)秀可視化Python庫

 對使用哪個可視化工具感到困惑? 我為您分解了每個庫的優(yōu)缺點

在隆化等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都網(wǎng)站建設(shè)、做網(wǎng)站 網(wǎng)站設(shè)計制作按需定制網(wǎng)站,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),高端網(wǎng)站設(shè)計,營銷型網(wǎng)站建設(shè),外貿(mào)網(wǎng)站建設(shè),隆化網(wǎng)站建設(shè)費用合理。

動機(jī)

如果您剛開始使用Python可視化,可能會不知所措的庫和示例數(shù)量眾多:

  • Matplotlib
  • Seaborn
  • Plotly
  • Bokeh
  • Altair
  • Folium

如果您有一個等待可視化的DataFrame,應(yīng)該選擇哪一個? 在某些情況下,某些庫可能比其他庫更好。 本文將展示每種方法的優(yōu)缺點。 到本文結(jié)尾,您應(yīng)該能夠區(qū)分每個庫的不同功能,并可以更輕松地選擇優(yōu)秀庫。

我們將通過使用樣本數(shù)據(jù)集并使用每個庫對其進(jìn)行研究,著重于一些特定的屬性:

互動性

您是否希望可視化是交互式的?

一些庫(例如Matplotlib)將可視化效果呈現(xiàn)為圖像。 因此,它們非常適合于解釋概念(在紙質(zhì),幻燈片或演示文稿中)。

另一方面,像Altair,Bokeh和Plotly這樣的庫可讓您創(chuàng)建交互式圖形,以便用戶可以深入并自己探索

語法和靈活性

每個庫的語法有何不同? Matplotlib等較低級的庫使您可以做想想得到的一切,但要付出更復(fù)雜的API的代價。 諸如Altair之類的某些庫是非常聲明性的,這使映射到您的數(shù)據(jù)更加容易。

數(shù)據(jù)類型和可視化

您是在處理特殊的用例,例如地理圖,具有大數(shù)據(jù)還是使用僅由特定庫支持的圖類型?

數(shù)據(jù)

為了便于比較,我將使用本文從Github抓取的真實數(shù)據(jù):

我爬取了超過1k的優(yōu)秀機(jī)器學(xué)習(xí)Github配置文件,這就是我發(fā)現(xiàn)的

從Github上的優(yōu)秀機(jī)器學(xué)習(xí)資料中獲取見解

或從Datapane Blob獲取直接數(shù)據(jù)。

 
 
 
  1. import datapane as dp 
  2.  
  3. dp.Blob.get(name='github_data', owner='khuyentran1401').download_df() 

 

如果要使用Blob,請記住預(yù)先使用令牌登錄Datapane。 此過程應(yīng)少于1分鐘

Matplotlib

Matplotlib可能是最常見的用于可視化數(shù)據(jù)的Python庫。 每個對數(shù)據(jù)科學(xué)感興趣的人都可能至少使用過Matplotlib。

優(yōu)點

1.容易看到數(shù)據(jù)的屬性

分析數(shù)據(jù)時,快速查看分布可能是理想的。

例如,如果我想快速了解關(guān)注者最多的前100個用戶的分布,通常使用Matplotlib就足夠了。

 
 
 
  1. import matplotlib.pyplot as plt 
  2.  
  3. top_followers = new_profile.sort_values(by='followers', axis=0, ascending=False)[:100] 
  4.  
  5. fig = plt.figure() 
  6.  
  7. plt.bar(top_followers.user_name, 
  8.        top_followers.followers) 

即使Matplotlib的x軸看起來不太好,通過查看圖表,我們也可以更好地理解數(shù)據(jù)的分布。

2.可以畫任何東西

Matplotlib具有多種用途,這意味著它可以繪制您可以想象的任何圖形。 Matplotlib的網(wǎng)站上包含非常全面的文檔和圖庫中的各種圖形,這使您可以輕松找到任何您能想到的瘋狂情節(jié)的教程。

像這樣的一些文字:

 
 
 
  1. fig = plt.figure() 
  2.  
  3. plt.text(0.6, 0.7, "learning", size=40, rotation=20., 
  4.          ha="center", va="center", 
  5.          bbox=dict(boxstyle="round", 
  6.                    ec=(1., 0.5, 0.5), 
  7.                    fc=(1., 0.8, 0.8), 
  8.                    ) 
  9.          ) 
  10.  
  11. plt.text(0.55, 0.6, "machine", size=40, rotation=-25., 
  12.          ha="right", va="top", 
  13.          bbox=dict(boxstyle="square", 
  14.                    ec=(1., 0.5, 0.5), 
  15.                    fc=(1., 0.8, 0.8), 
  16.                    ) 
  17.          ) 
  18.  
  19. plt.show() 

 

缺點

Matplotlib可以繪制任何內(nèi)容,但繪制非基本圖或調(diào)整圖的外觀可能會很復(fù)雜。

 
 
 
  1. correlation = new_profile.corr() 
  2.  
  3. fig, ax = plt.subplots() 
  4. im = plt.imshow(correlation) 
  5.  
  6. ax.set_xticklabels(correlation.columns) 
  7. ax.set_yticklabels(correlation.columns) 
  8.  
  9. plt.setp(ax.get_xticklabels(), rotation=45, ha="right", 
  10.          rotation_mode="anchor") 

 

即使該圖足以使分布可視化,但如果您想將數(shù)據(jù)表示給其他人,您仍需要固定x軸,y軸,這需要很多工作。 這是因為Matplotlib具有非常低級的接口。

總結(jié):Matplotlib可以繪制任何東西,但是復(fù)雜的繪圖可能比其他庫需要更多的代碼

Seaborn

Seaborn是基于Matplotlib的Python數(shù)據(jù)可視化庫。 它在庫上提供了更高級別的包裝器,使其更易于使用。

優(yōu)點

1.更少的代碼

它為類似的圖提供了更高級別的界面。 換句話說,seaborn通常提供與matplotlib類似的圖,但是用更少的代碼和更好的設(shè)計。

我們使用與以前相同的數(shù)據(jù)來繪制圖的相似熱圖。

 
 
 
  1. correlation = new_profile.corr() 
  2.  
  3. sns.heatmap(correlation, annot=True) 

我們無需設(shè)置x和y標(biāo)簽就可以獲得更好的熱圖!

2.使常用地塊更漂亮

當(dāng)涉及流行圖(例如條形圖,箱形圖,計數(shù)圖,直方圖等)時,許多人選擇seaborn不僅是因為可以用更少的代碼來創(chuàng)建它們,而且它們看起來也更漂亮。 正如我們在上面的示例中看到的,顏色看起來也比Matplotlib的默認(rèn)顏色更好。

 
 
 
  1. sns.set(style="darkgrid") 
  2. titanic = sns.load_dataset("titanic") 
  3. ax = sns.countplot(x="class", data=titanic) 

 

缺點

Seaborn受到更多限制,并且沒有matplotlib那樣廣泛的集合

要點:Seaborn是Matplotlib的更高版本。 盡管Seaborn并不像Matplotlib那樣具有廣泛的集合,但是它們卻可以用更少的代碼來使條形圖,箱形圖,熱圖等流行圖看起來很漂亮。

Plotly

Plotly的Python圖形庫使創(chuàng)建交互式,具有出版物質(zhì)量的圖形變得容易。 它還可以創(chuàng)建類似于Matplotlib和seaborn的圖表,例如折線圖,散點圖,面積圖,條形圖等。

優(yōu)點

1. 像R

如果您喜歡R中的繪圖,并且在切換到Python時錯過了它的功能,那么Plotly使用Python可以提供相同質(zhì)量的繪圖!

我最喜歡的是Plotly Express,因為它真的很容易,而且用單行Python創(chuàng)建更好的圖甚至更快。

 
 
 
  1. fig = px.scatter(new_profile[:100], 
  2.           x='followers', 
  3.           y='total_stars', 
  4.           color='forks', 
  5.           size='contribution') 
  6. fig.show() 

 

2.易于創(chuàng)建交互式圖

使用Plotly還可以輕松創(chuàng)建交互式繪圖。 交互式繪圖不僅美觀,而且還使查看者更容易查看每個數(shù)據(jù)點。

還記得我們之前使用matplotlib制作的條形圖嗎? 讓我們看看Plotly的結(jié)果

 
 
 
  1. import plotly.express as px 
  2.  
  3. top_followers = new_profile.sort_values(by='followers', axis=0, ascending=False)[:100] 
  4.  
  5. fig = px.bar(top_followers,  
  6.              x='user_name',  
  7.              y='followers', 
  8.             ) 
  9.  
  10. fig.show() 

 

使用大約相同的代碼行,我們生成一個交互式繪圖,我們可以將鼠標(biāo)懸停在每個欄上,以查看該欄所代表的用戶和關(guān)注者數(shù)量。 這意味著可視化的使用者可以自己進(jìn)行瀏覽。

3.復(fù)雜的地塊變得容易

使用Plotly,可以輕松創(chuàng)建一些通常很難創(chuàng)建的圖。

例如,如果我們想創(chuàng)建一個地圖以可視化Github用戶的位置,我們可以找到他們的經(jīng)度和緯度,如下所示,然后使用該數(shù)據(jù)在地圖上發(fā)現(xiàn)用戶的位置,如下所示

 
 
 
  1. import plotly.express as px 
  2. import datapane as dp 
  3.  
  4. location_df = dp.Blob.get(name='location_df', owner='khuyentran1401').download_df() 
  5.  
  6. m = px.scatter_geo(location_df, lat='latitude', lon='longitude', 
  7.                  color='total_stars', size='forks', 
  8.                  hover_data=['user_name','followers'], 
  9.                  title='Locations of Top Users') 
  10.  
  11. m.show() 

 

只需幾行代碼,所有用戶的位置就可以在地圖上精美呈現(xiàn)。 氣泡的顏色代表叉子的數(shù)量,大小代表星星的總數(shù)

缺點

盡管Plotly支持各種圖,但仍然缺少一些常見圖

例如,雖然seaborn具有sns.countplot()來計算數(shù)據(jù)中某個類別的出現(xiàn)次數(shù),但Plotly沒有計數(shù)圖。 因此,我們需要預(yù)先執(zhí)行g(shù)roupby以便按類對數(shù)據(jù)進(jìn)行分組。

 
 
 
  1. titanic = sns.load_dataset("titanic") 
  2.  
  3. # Group data by class 
  4. titanic_groupby = titanic.groupby(by='class').count()  
  5.  
  6. fig = px.bar(titanic_groupby, 
  7.       y='survived', 
  8.       labels={'survived':'count'})  
  9. fig.show() 

 

我們需要更多代碼來創(chuàng)建計數(shù)圖,并且該圖不會像seaborn那樣自動顯示出來。

要點:Plotly非常適合用很少的代碼創(chuàng)建交互式且具有出版質(zhì)量的圖形。 但是,對于一些簡單的圖(例如計數(shù)圖),使用seaborn會更簡單

Altar

Altair是基于vega-lite的用于Python的聲明式統(tǒng)計可視化庫,非常適合需要大量統(tǒng)計轉(zhuǎn)換的繪圖。

優(yōu)點

1.簡單的可視化語法

用于創(chuàng)建可視化的語法很容易理解。 它僅需提及數(shù)據(jù)列與編碼通道之間的鏈接,其余繪圖將自動處理。 這聽起來很抽象,但是在您處理數(shù)據(jù)時非常重要,它使信息可視化變得非??焖俸椭庇^。

例如,使用上面的泰坦尼克號數(shù)據(jù),我們想計算每個班級的人數(shù),我們所需要的只是在y_axis中使用count()

 
 
 
  1. import seaborn as sns 
  2. import altair as alt  
  3.  
  4. titanic = sns.load_dataset("titanic") 
  5.  
  6. alt.Chart(titanic).mark_bar().encode( 
  7.     alt.X('class'), 
  8.     y='count()' 

 

2.易于轉(zhuǎn)換數(shù)據(jù)

Altair還使創(chuàng)建圖表時轉(zhuǎn)換數(shù)據(jù)變得非常容易

例如,如果我們想找到泰坦尼克號中每個性別的平均年齡,而不是像Plotly那樣預(yù)先進(jìn)行轉(zhuǎn)換,我們可以在代碼中執(zhí)行轉(zhuǎn)換以創(chuàng)建圖表。

 
 
 
  1. hireable = alt.Chart(titanic).mark_bar().encode( 
  2.     x='sex:N', 
  3.     y='mean_age:Q' 
  4. ).transform_aggregate( 
  5.     mean_age='mean(age)', 
  6.     groupby=['sex']) 
  7.  
  8. hireable 

 

這里的邏輯是使用transform_aggregate()來獲取義數(shù)據(jù)(沒有任何順序的類別數(shù)據(jù)),或者使用:Q來確保mean_age是定量數(shù)據(jù)(值的度量,例如數(shù)字)

3.易于鏈接的圖

Altair還允許您在圖之間進(jìn)行一些令人印象深刻的鏈接,例如使用間隔選擇來過濾附加直方圖的內(nèi)容。

例如,如果我們想在間隔內(nèi)可視化每個班級的人數(shù),我們可以選擇年齡和票價之間的一個點狀圖,我們可以這樣做。

 
 
 
  1. brush = alt.selection(type='interval') 
  2.  
  3. points = alt.Chart(titanic).mark_point().encode( 
  4.     x='age:Q', 
  5.     y='fare:Q', 
  6.     color=alt.condition(brush, 'class:N', alt.value('lightgray')) 
  7. ).add_selection( 
  8.     brush 
  9.  
  10. bars = alt.Chart(titanic).mark_bar().encode( 
  11.     y='class:N', 
  12.     color='class:N', 
  13.     x = 'count(class):Q' 
  14. ).transform_filter( 
  15.     brush 
  16.  
  17. points & bars 

 

當(dāng)我們拖動鼠標(biāo)以選擇散點圖中的間隔時,我們可以在下面的條形圖中看到變化。 當(dāng)與早期的轉(zhuǎn)換和計算結(jié)合使用時,這意味著您可以創(chuàng)建一些非?;拥膱D,這些圖可以進(jìn)行即時計算-甚至不需要運行的Python服務(wù)器!

缺點

除非您指定自定義樣式,否則簡單的圖表(如條形圖)看起來不會像seaborn或Plotly。 Altair還不建議使用5000個以上樣本的數(shù)據(jù)集,而是建議您在可視化之前匯總數(shù)據(jù)。

要點:Altair是復(fù)雜圖表顯示統(tǒng)計數(shù)據(jù)的理想選擇。 Altair無法處理超過5000個樣本的數(shù)據(jù),并且與Plotly或Seaborn相比,某些簡單圖表的樣式看起來不一樣。

Bokeh

Bokeh是一個靈活的交互式可視化庫,以Web瀏覽器為代表。

優(yōu)點

  • Matplotlib的交互式版本

如果我們將在上述交互式可視化庫中排名,那么Bokeh在與Matplotlib的相似性方面可能排名第一。

Matplotlib可以創(chuàng)建任何繪圖,因為它是一個低級的可視化庫。 Bokeh可以用作高級或低級接口; 因此,它可以創(chuàng)建Matplotlib創(chuàng)建的許多復(fù)雜圖,但是用更少的代碼行和更高的分辨率。

例如,Matplotlib的圓圖

 
 
 
  1. import matplotlib.pyplot as plt 
  2.  
  3. fig, ax = plt.subplots() 
  4.  
  5. x = [1, 2, 3, 4, 5] 
  6. y = [2, 5, 8, 2, 7] 
  7.  
  8. for x,y in zip(x,y):  
  9.     ax.add_patch(plt.Circle((x, y), 0.5, edgecolor = "#f03b20",facecolor='#9ebcda', alpha=0.8)) 
  10.  
  11.  
  12. #Use adjustable='box-forced' to make the plot area square-shaped as well. 
  13. ax.set_aspect('equal', adjustable='datalim') 
  14. ax.set_xbound(3, 4) 
  15.  
  16. ax.plot()   #Causes an autoscale update. 
  17. plt.show() 

 

也可以使用Bokeh以更好的分辨率和更多實用性創(chuàng)建

 
 
 
  1. from bokeh.io import output_file, show 
  2. from bokeh.models import Circle 
  3. from bokeh.plotting import figure 
  4.  
  5. reset_output() 
  6. output_notebook() 
  7.  
  8.  
  9. plot = figure(plot_width=400, plot_height=400, tools="tap", title="Select a circle") 
  10. renderer = plot.circle([1, 2, 3, 4, 5], [2, 5, 8, 2, 7], size=50) 
  11.  
  12. selected_circle = Circle(fill_alpha=1, fill_color="firebrick", line_color=None) 
  13. nonselected_circle = Circle(fill_alpha=0.2, fill_color="blue", line_color="firebrick") 
  14.  
  15. renderer.selection_glyph = selected_circle 
  16. renderer.nonselection_glyph = nonselected_circle 
  17.  
  18. show(plot) 

 

2.地塊之間的聯(lián)系

散景還可以使情節(jié)之間的鏈接變得非常容易。 在一個繪圖中應(yīng)用的更改將應(yīng)用于具有類似變量的另一繪圖。

例如,如果我們并排創(chuàng)建3個圖形并想要觀察它們之間的關(guān)系,則可以使用鏈接的筆刷

 
 
 
  1. from bokeh.layouts import gridplot, row 
  2. from bokeh.models import ColumnDataSource 
  3.  
  4. reset_output() 
  5. output_notebook() 
  6.  
  7. source = ColumnDataSource(new_profile) 
  8.  
  9. TOOLS = "box_select,lasso_select,help" 
  10. TOOLTIPS = [('user', '@user_name'), 
  11.             ('followers', '@followers'), 
  12.             ('following', '@following'), 
  13.             ('forks', '@forks'),  
  14.             ('contribution', '@contribution')] 
  15.  
  16. s1 = figure(tooltips=TOOLTIPS, plot_width=300, plot_height=300, title=None, tools=TOOLS) 
  17. s1.circle(x='followers', y='following', source=source) 
  18.  
  19. s2 = figure(tooltips=TOOLTIPS, plot_width=300, plot_height=300, title=None, tools=TOOLS) 
  20. s2.circle(x='followers', y='forks', source=source) 
  21.  
  22. s3 = figure(tooltips=TOOLTIPS, plot_width=300, plot_height=300, title=None, tools=TOOLS) 
  23. s3.circle(x='followers', y='contribution', source=source) 
  24.  
  25. p = gridplot([[s1,s2,s3]]) 
  26. show(p) 

 

ColumnDataSource使數(shù)據(jù)可以在繪圖之間共享。 因此,當(dāng)我們將更改應(yīng)用于一個圖時,其他圖也將相應(yīng)地更改。

缺點

由于Bokeh是一個具有中級接口的庫,因此與Matplotlib相比,它通?;ㄙM較少的代碼,但產(chǎn)生與Seaborn,Altair或Plotly相同的圖將花費更多的代碼。

例如,要使用泰坦尼克號數(shù)據(jù)創(chuàng)建相同的計數(shù)圖,除了需要預(yù)先轉(zhuǎn)換數(shù)據(jù)外,如果我們希望圖形看起來更漂亮,我們還需要設(shè)置條形和顏色的寬度

 
 
 
  1. from bokeh.transform import factor_cmap 
  2. from bokeh.palettes import Spectral6 
  3.  
  4. p = figure(x_range=list(titanic_groupby['class'])) 
  5. p.vbar(x='class', top='survived', source = titanic_groupby, 
  6.       fill_color=factor_cmap('class', palette=Spectral6, factors=list(titanic_groupby['class']) 
  7.       )) 
  8. show(p)如果我們不為條形圖添加寬度,則條形圖將看起來像這樣 

 

 

因此,我們需要手動調(diào)整尺寸以使圖更好

 
 
 
  1. from bokeh.transform import factor_cmap 
  2. from bokeh.palettes import Spectral6 
  3.  
  4. p = figure(x_range=list(titanic_groupby['class'])) 
  5. p.vbar(x='class', top='survived', width=0.9, source = titanic_groupby, 
  6.       fill_color=factor_cmap('class', palette=Spectral6, factors=list(titanic_groupby['class']) 
  7.       )) 
  8. show(p) 

如果要用更少的代碼創(chuàng)建漂亮的條形圖,與其他庫相比,Bokeh可能就是缺點

要點:Bokeh是唯一一個界面范圍從低到高的庫,這使得生成通用和精美的圖形變得容易。 但是,這樣做的代價是,Bokeh通常需要更多代碼來創(chuàng)建質(zhì)量與其他庫相似的圖。

Folium

Folium使在交互式傳單地圖上的數(shù)據(jù)可視化變得容易。 該庫具有來自O(shè)penStreetMap,Mapbox和Stamen的許多內(nèi)置磁貼集

優(yōu)點

1.輕松創(chuàng)建帶有標(biāo)記的地圖

盡管Plotly,Altair和Bokeh也使我們能夠創(chuàng)建地圖,但Folium使用開放的街道地圖,以最少的代碼使您更接近Google Map

還記得我們?nèi)绾蝿?chuàng)建地圖以使用Plotly可視化Github用戶的位置嗎? 我們可以用Folium使地圖看起來更好

 
 
 
  1. import folium 
  2.  
  3. # Load data 
  4. location_df = dp.Blob.get(name='location_df', owner='khuyentran1401').download_df()  
  5.  
  6. # Save latitudes, longitudes, and locations' names in a list 
  7. lats = location_df['latitude'] 
  8. lons = location_df['longitude'] 
  9. names = location_df['location'] 
  10.  
  11. # Create a map with an initial location 
  12. m = folium.Map(location=[lats[0], lons[0]]) 
  13.  
  14. for lat, lon, name in zip(lats, lons, names): 
  15.    
  16.     # Create marker with other locations 
  17.     folium.Marker(location=[lat, lon], 
  18.                   popup= name,  
  19.                  icon=folium.Icon(color='green') 
  20. ).add_to(m) 
  21.      

 

最初的地點在紐約布魯克林。 縮小以查看地圖上的其他位置。 通過一些代碼行,我們創(chuàng)建了一個真實的地圖,顯示了用戶的位置。

2.添加潛在的位置

如果我們想添加其他用戶的潛在位置,F(xiàn)olium可以通過允許用戶添加標(biāo)記來簡化操作

 
 
 
  1. # Code to generate map here 
  2. #.... 
  3.  
  4. # Enable adding more locations in the map 
  5. m = m.add_child(folium.ClickForMarker(popup='Potential Location')) 

 

點擊地圖,查看您點擊生成的新位置。

3.插件

Folium有許多可與地圖一起使用的插件,包括Altair的插件。 如果我們想查看全球Github用戶總星數(shù)的熱點圖,以找出哪里有大量Github用戶數(shù)最多,總星數(shù)很多的情況? Folium插件中的熱圖使您可以做到這一點。

 
 
 
  1. from folium.plugins import HeatMap 
  2.  
  3. m = folium.Map(location=[lats[0], lons[0]]) 
  4.  
  5. HeatMap(data=location_df[['latitude', 'longitude', 'total_stars']]).add_to(m) 

 

縮小以查看完整的熱圖。

總結(jié):Folium允許您使用幾行代碼創(chuàng)建一個交互式地圖。 它為您提供了接近Google Map的體驗。

結(jié)論

恭喜你! 您剛剛了解了用于可視化的六個不同的可視化工具。 我希望本文能使您了解每個庫的功能以及何時使用。 掌握每個庫的關(guān)鍵功能將使您更快地根據(jù)需要提取正確的庫。

如果您仍然對要使用哪個庫來處理數(shù)據(jù)感到困惑,只需選擇一個您認(rèn)為足夠好的庫即可。 然后,如果代碼太長或圖形的顯示效果不如您想象的那樣,請嘗試使用另一個庫!


新聞標(biāo)題:6個優(yōu)秀可視化Python庫
瀏覽地址:http://www.5511xx.com/article/djjiicj.html