新聞中心
在Python中,describe并不是一個(gè)內(nèi)置函數(shù)或關(guān)鍵字,但在某些庫(如pandas)中,describe是一個(gè)用于快速獲取數(shù)據(jù)集統(tǒng)計(jì)信息的函數(shù),這里,我們將主要討論pandas庫中的describe函數(shù)的用法。

創(chuàng)新互聯(lián)建站專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計(jì)、石城網(wǎng)絡(luò)推廣、微信平臺(tái)小程序開發(fā)、石城網(wǎng)絡(luò)營銷、石城企業(yè)策劃、石城品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);創(chuàng)新互聯(lián)建站為所有大學(xué)生創(chuàng)業(yè)者提供石城建站搭建服務(wù),24小時(shí)服務(wù)熱線:028-86922220,官方網(wǎng)址:www.cdcxhl.com
我們需要安裝pandas庫,可以通過以下命令安裝:
pip install pandas
接下來,我們將詳細(xì)介紹describe函數(shù)在pandas中的用法。
1、導(dǎo)入pandas庫
在使用describe函數(shù)之前,我們需要先導(dǎo)入pandas庫,并創(chuàng)建一個(gè)DataFrame對(duì)象。
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]
}
df = pd.DataFrame(data)
2、使用describe函數(shù)
describe函數(shù)可以對(duì)DataFrame對(duì)象進(jìn)行統(tǒng)計(jì)分析,返回一個(gè)新的DataFrame對(duì)象,包含以下統(tǒng)計(jì)信息:
count:非空值的數(shù)量
mean:平均值
std:標(biāo)準(zhǔn)差
min:最小值
25%:第一四分位數(shù)(25%分位數(shù))
50%:中位數(shù)(50%分位數(shù))
75%:第三四分位數(shù)(75%分位數(shù))
max:最大值
statistics = df.describe() print(statistics)
輸出結(jié)果如下:
A B C
count 5.000000 5.000000 5.000000
mean 3.000000 30.000000 300.000000
std 1.581139 15.811388 158.113883
min 1.000000 10.000000 100.000000
25% 2.000000 20.000000 200.000000
50% 3.000000 30.000000 300.000000
75% 4.000000 40.000000 400.000000
max 5.000000 50.000000 500.000000
3、自定義describe函數(shù)的統(tǒng)計(jì)信息
describe函數(shù)還允許我們自定義需要計(jì)算的統(tǒng)計(jì)信息,我們可以只計(jì)算平均值和標(biāo)準(zhǔn)差:
statistics = df.describe(percentiles=[.5, .75], include='all') print(statistics)
輸出結(jié)果如下:
A B C
count 5.000000 5.0 5.000000
mean 3.000000 30.0 300.000000
std 1.581139 15.811388 158.113883
50% 3.000000 30.0 300.000000
75% 4.000000 40.0 400.000000
4、對(duì)特定列應(yīng)用describe函數(shù)
如果我們只想對(duì)DataFrame中的特定列應(yīng)用describe函數(shù),可以使用以下方法:
statistics = df[['A', 'B']].describe() print(statistics)
輸出結(jié)果如下:
A B
count 5.000000 5.000000
mean 3.000000 30.000000
std 1.581139 15.811388
min 1.000000 10.000000
25% 2.000000 20.000000
50% 3.000000 30.000000
75% 4.000000 40.000000
max 5.000000 50.000000
總結(jié)一下,describe函數(shù)是pandas庫中的一個(gè)非常實(shí)用的函數(shù),可以幫助我們快速獲取數(shù)據(jù)集的統(tǒng)計(jì)信息,通過本文的介紹,相信大家已經(jīng)掌握了describe函數(shù)的基本用法,可以在實(shí)際項(xiàng)目中靈活運(yùn)用。
分享文章:describe在python中的用法
新聞來源:http://www.5511xx.com/article/cdgodhp.html


咨詢
建站咨詢
