基礎(chǔ)
以下操作基于python 3.6 windows 10 環(huán)境下 通過(guò)
將通過(guò)實(shí)例來(lái)演示三者的區(qū)別
toward_dict = {1: '東', 2: '南', 3: '西', 4: '北'}
df = pd.DataFrame({'house' : list('AABCEFG'),
'price' : [100, 90, '', 50, 120, 150, 200],
'toward' : ['1','1','2','3','','3','2']})
df
map()方法
通過(guò)df.(tab)鍵,發(fā)現(xiàn)df的屬性列表中有apply() 和 applymap(),但沒有map().
map()是python 自帶的方法, 可以對(duì)df某列內(nèi)的元素進(jìn)行操作, 我個(gè)人最常用的場(chǎng)景就是有toward_dict
的映射關(guān)系 ,為df中的toward
匹配出結(jié)果,
df['朝向'] = df.toward.map(toward_dict);df
結(jié)果就是沒有匹配出來(lái), why???
因?yàn)?code>df.toward這列數(shù)字是str型的, toward_dict
中的key是int型,下面修正操作下:兩個(gè)思路:
第一種思路:`toward_dict`的key轉(zhuǎn)換為str型
toward_dict2 = dict((str(key), val) for key, val in toward_dict.items())
# 第二種思路, 將df.toward轉(zhuǎn)為int型
df.toward = df.toward.map(lambda x: np.nan if x == '' else x).map(int,na_action='ignore')
df['朝向2'] = df.toward.map(toward_dict);df
apply() 方法
更新時(shí)間: 2018-08-10
我目前的實(shí)際工作中使用apply()
方法比較少, 所以整理的內(nèi)容比較簡(jiǎn)陋, 后續(xù)涉及到數(shù)據(jù)分析方面可能會(huì)應(yīng)用比較多些.
先將上面的測(cè)試中的map
替換為apply
,看看怎么樣?
結(jié)果報(bào)錯(cuò)了, ValueError
, 還是老老實(shí)實(shí)寫實(shí)際操作例子吧 ?
參考DataFrame.apply官方文檔
文檔中第一個(gè)參數(shù):
func : function
Function to apply to each column or row.
意思即是, 將傳入的func
應(yīng)用到每一列或每一行,進(jìn)行元素級(jí)別的運(yùn)算
第二個(gè)參數(shù):
axis : {0 or ‘index', 1 or ‘columns'}, default 0
Axis along which the function is applied:
0 or ‘index': apply function to each column. # 注意這里的解釋
1 or ‘columns': apply function to each row.
舉例:
這個(gè)要特別注意的,
沒有繼續(xù)使用map里的DF, 是因?yàn)閐f.house是字符串, 不能進(jìn)行np.sum
運(yùn)算,會(huì)報(bào)錯(cuò).
2018年12月3日
新增:
最近在工作中使用到了pandas.apply()
方法,更新如下:
背景介紹:
一個(gè) df
有三個(gè)列需要進(jìn)行計(jì)算,change_type
值 為1和0, 1為漲價(jià),0為降價(jià), price
為現(xiàn)價(jià), changed
為漲降價(jià)的絕對(duì)值, 現(xiàn)求:漲降價(jià)的比例, 精確到0位,無(wú)小數(shù)位,
解決思路:
1.最主要的計(jì)算是: 漲降價(jià)的絕對(duì)值/ 原價(jià)
2.最主要的難點(diǎn)是: 漲價(jià)的原價(jià) = 現(xiàn)價(jià) - 絕對(duì)值
降價(jià)的原價(jià) = 現(xiàn)價(jià) + 絕對(duì)值
偽代碼如下: 漲降價(jià)比例 = round(changed/(price 加上或減去 changed), 0)
就是我需求的結(jié)果了.
解決方案 如下:
以下代碼經(jīng)過(guò)win 10 環(huán)境 python3.6 版本測(cè)試通過(guò)
import pandas as pd
df = pd.DataFrame({'change_type' : [1,1,0,0,1,0],
'price' : [100, 90, 50, 120, 150, 200],
'changed' : [10,8,4,11,14,10]})
def get_round(change_type, price, changed_val):
"""
策略設(shè)計(jì)
"""
if change_type == 0:
return round(changed_val/(price + changed_val) * 100, 2)
elif change_type == 1:
return round(changed_val/(price - changed_val) * 100, 2)
else:
print(f'{change} is not exists')
# 策略實(shí)現(xiàn)
df['round'] = df.apply(lambda x: get_round(x['change_type'], x['price'], x['changed']),axis=1)
若有問(wèn)題, 歡迎指正, 謝謝
applymap()
參考DataFrame.applymap官方文檔:
func : callable
Python function, returns a single value from a single value.
文檔很簡(jiǎn)單, 只有一個(gè)參數(shù), 即傳入的func
方法
樣例參考文檔吧, 沒有比這個(gè)更簡(jiǎn)單了
總結(jié):
map() 方法是pandas.series.map()方法, 對(duì)DF中的元素級(jí)別的操作, 可以對(duì)df的某列或某多列, 可以參考文檔
apply(func) 是DF的屬性, 對(duì)DF中的行數(shù)據(jù)或列數(shù)據(jù)應(yīng)用func
操作.
applymap(func) 也是DF的屬性, 對(duì)整個(gè)DF所有元素應(yīng)用func
操作
到此這篇關(guān)于pandas map(),apply(),applymap()區(qū)別解析的文章就介紹到這了,更多相關(guān)pandas map(),apply(),applymap()內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- pandas使用函數(shù)批量處理數(shù)據(jù)(map、apply、applymap)
- Pandas對(duì)DataFrame單列/多列進(jìn)行運(yùn)算(map, apply, transform, agg)
- 淺談Pandas中map, applymap and apply的區(qū)別