import pandas as pd import numpy as np a=np.array([['北京','北方','一線','非沿海'],['杭州','南方','二線','非沿海'],['深圳','南方','一線','沿海'],['煙臺','北方','三線','沿海']]) df=pd.DataFrame(a,index=['一','二','三','四'],columns=['城市','地理','級別','是否沿海'])
城市 地理 級別 是否沿海
一 北京 北方 一線 非沿海
二 杭州 南方 二線 非沿海
三 深圳 南方 一線 沿海
四 煙臺 北方 三線 沿海
loc標簽是軸標簽,也就是我們的索引名,使用也非常簡單
df.loc['二']
城市 杭州
地理 南方
級別 二線
是否沿海 非沿海
Name: 二, dtype: object
iloc為整數(shù)標簽,類似我們使用的元組列表的索引。比如我們想選擇第二行的數(shù)據(jù),第二行的索引則為1.
df.iloc[1]
城市 杭州
地理 南方
級別 二線
是否沿海 非沿海
Name: 二, dtype: object
如果我們知道列索引,那么選擇某一列則變得十分簡單
df['級別']
一 一線
二 二線
三 一線
四 三線
Name: 級別, dtype: object
正如我們上述使用iloc的方法,我們只需傳入行或者列的索引即可。其實iloc的中括號里可以輸入兩個參數(shù)。前面為行,后面為列中間用逗號隔開。(如果省略了逗號,則默認取選擇行)
比如現(xiàn)在我們想選擇第二列,我們只需在逗號錢輸入: 代表所有的行,后面則輸入1代表第二列
df.iloc[:, 1]
一 北方
二 南方
三 南方
四 北方
Name: 地理, dtype: object
和iloc的使用相似,只不過在數(shù)據(jù)篩選中我們不再使用行整數(shù)索引,而是具體的索引值。
df.loc[:, '是否沿海']
一 非沿海
二 非沿海
三 沿海
四 沿海
Name: 是否沿海, dtype: object
其實loc與iloc是dataframe中選擇數(shù)據(jù)最高效的方式,他的功能也十分強大。我們可以隨意組合。
比如我們現(xiàn)在選擇第二行的中間兩列
df.iloc[1,1:3]
地理 南方
級別 二線
Name: 二, dtype: object
當然我們也可以不使用整數(shù)索引
df.loc['二':,'地理':'級別']
地理 級別
二 南方 二線
三 南方 一線
四 北方 三線
比如我們想選擇第二到三行的第二列和第三列
df.iloc[2:4:, 2:4]
級別 是否沿海
三 一線 沿海
四 三線 沿海
同樣十分簡單,通過loc使用效果相同,這里不過多描述
選擇某幾列
df.iloc[:,2:4]
級別 是否沿海
一 一線 非沿海
二 二線 非沿海
三 一線 沿海
四 三線 沿海
選擇某幾行
城市 地理 級別 是否沿海
二 杭州 南方 二線 非沿海
三 深圳 南方 一線 沿海
如果把dataframe看做一個表格,這里可以看成獲得表格里某個單元格的值
iat即為整數(shù)標簽
df.iat[2,2]
'一線'
at即為具體的索引值去獲取
df.at['三','級別']
'一線'
到此這篇關于十分鐘輕松掌握dataframe數(shù)據(jù)選擇的文章就介紹到這了,更多相關dataframe數(shù)據(jù)選擇內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!