主頁 > 知識庫 > Pandas 實現(xiàn)分組計數(shù)且不計重復(fù)

Pandas 實現(xiàn)分組計數(shù)且不計重復(fù)

熱門標(biāo)簽:原裝電話機器人 千陽自動外呼系統(tǒng) 江蘇客服外呼系統(tǒng)廠家 西藏智能外呼系統(tǒng)五星服務(wù) 400電話申請服務(wù)商選什么 清遠(yuǎn)360地圖標(biāo)注方法 在哪里辦理400電話號碼 工廠智能電話機器人 平頂山外呼系統(tǒng)免費

在對dataframe進(jìn)行分析的時候會遇到需要分組計數(shù),計數(shù)的column中屬性有重復(fù),但又需要僅對不重復(fù)的項計數(shù)(即重復(fù)N次出現(xiàn)的項只計1次)。

函數(shù)如下:

dataframe.groupby([‘分組的列名']).需要計數(shù)的列名.nunique()

舉例:

數(shù)組“data”如下:

StoreID Sales SalesDate Channel
A 100 2018/1/1 01
A 90 2018/1/1 02
A 110 2018/1/2 01
B 82.2 2018/1/1 01
B 90 2018/1/2 02

如果要按StoreID來統(tǒng)計每一家店的營業(yè)日期數(shù)(可以通過不計重復(fù)的count “SalesDate”來完成)

代碼如下:

data.groupby(['StoreID']).SalesDate.nunique()

補充:pandas 統(tǒng)計分組內(nèi)不重復(fù)計數(shù)

在數(shù)據(jù)分析中的數(shù)據(jù)處理過程中,經(jīng)常需要對數(shù)據(jù)進(jìn)行分組計數(shù),看下下面這組數(shù)據(jù)

數(shù)據(jù)中name 為C 的有三行,其中有2個code是重復(fù)的

目標(biāo):

按name 分組,統(tǒng)計每組中code的不重復(fù)數(shù)量

df.groupby('name')['code'].nunique()
# 以name 分組后,統(tǒng)計code的不重復(fù)數(shù)目

結(jié)果如下:

排序

df.groupby('name')['code'].nunique().sort_values(ascending=False)
# 以name 分組后,統(tǒng)計code的不重復(fù)數(shù)目

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • 利用pandas按日期做分組運算的操作
  • pandas 實現(xiàn)某一列分組,其他列合并成list
  • pandas 實現(xiàn)分組后取第N行
  • pandas分組排序 如何獲取第二大的數(shù)據(jù)
  • pandas group分組與agg聚合的實例
  • pandas groupby分組對象的組內(nèi)排序解決方案

標(biāo)簽:日照 天水 白城 西安 錦州 隨州 股票 安慶

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Pandas 實現(xiàn)分組計數(shù)且不計重復(fù)》,本文關(guān)鍵詞  Pandas,實現(xiàn),分組,計數(shù),且,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Pandas 實現(xiàn)分組計數(shù)且不計重復(fù)》相關(guān)的同類信息!
  • 本頁收集關(guān)于Pandas 實現(xiàn)分組計數(shù)且不計重復(fù)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章