用awk進行文本處理,少不了就是它的數(shù)組處理。那么awk數(shù)組有那些特點,一般常見運算又會怎么樣呢。我們先看下下面的一些介紹,結(jié)合例子我們會講解下它的不同之處。在 awk 中數(shù)組叫做關(guān)聯(lián)數(shù)組(associative arrays),因為下標記可以是數(shù)也可以是串。awk 中的數(shù)組不必提前聲明,也不必聲明大小。數(shù)組元素用 0 或空串來初始化,這根據(jù)上下文而定。例如:
一、定義方法
1:可以用數(shù)值作數(shù)組索引(下標)
Tarray[1]=“cheng mo”
Tarray[2]=“800927”
2:可以用字符串作數(shù)組索引(下標)
Tarray[“first”]=“cheng ”
Tarray[“last”]=”mo”
Tarray[“birth”]=”800927”
使用中 print Tarray[1] 將得到”cheng mo” 而 print Tarray[2] 和 print[“birth”] 都將得到 ”800927” 。
二、數(shù)組相關(guān)函數(shù)
[chengmo@localhost ~]$ awk --version
GNU Awk 3.1.5 /p>
p>使用版本是:3.1以上,不同版本下面函數(shù)不一定相同
得到數(shù)組長度(length方法使用)
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}'
4 4
length返回字符串以及數(shù)組長度,split進行分割字符串為數(shù)組,也會返回分割得到數(shù)組長度。 /p>
p>(asort使用):
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}'
4
asort對數(shù)組進行排序,返回數(shù)組長度。
輸出數(shù)組內(nèi)容(無序,有序輸出):
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'
4 test
1 it
2 is
3 a
for…in 輸出,因為數(shù)組是關(guān)聯(lián)數(shù)組,默認是無序的。所以通過for…in 得到是無序的數(shù)組。如果需要得到有序數(shù)組,需要通過下標獲得。
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k=tlen;k++){print k,tA[k];}}'
1 it
2 is
3 a
4 test
注意:數(shù)組下標是從1開始,與c數(shù)組不一樣。
判斷鍵值存在以及刪除鍵值:
一個錯誤的判斷方法:
[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}'
no found
a a1
b b1
c
以上出現(xiàn)奇怪問題,tB[“c”]沒有定義,但是循環(huán)時候,發(fā)現(xiàn)已經(jīng)存在該鍵值,它的值為空,這里需要注意,awk數(shù)組是關(guān)聯(lián)數(shù)組,只要通過數(shù)組引用它的key,就會自動創(chuàng)建改序列.
正確判斷方法:
[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if( "c" in tB){print "ok";};for(k in tB){print k,tB[k];}}'
a a1
b b1
if(key in array) 通過這種方法判斷數(shù)組中是否包含”key”鍵值。
刪除鍵值:
[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}'
b b1
delete array[key]可以刪除,對應數(shù)組key的,序列值。/p>
p>
三、二維數(shù)組使用(多維數(shù)組使用)
awk的多維數(shù)組在本質(zhì)上是一維數(shù)組,更確切一點,awk在存儲上并不支持多維數(shù)組。awk提供了邏輯上模擬二維數(shù)組的訪問方式。例 如,array[2,4] = 1這樣的訪問是允許的。awk使用一個特殊的字符串SUBSEP (\034)作為分割字段,在上面的例子中,關(guān)聯(lián)數(shù)組array存儲的鍵值實際上是2\0344。/p>
p>類似一維數(shù)組的成員測試,多維數(shù)組可以使用 if ( (i,j) in array)這樣的語法,但是下標必須放置在圓括號中。
類似一維數(shù)組的循環(huán)訪問,多維數(shù)組使用 for ( item in array )這樣的語法遍歷數(shù)組。與一維數(shù)組不同的是,多維數(shù)組必須使用split()函數(shù)來訪問單獨的下標分量。split ( item, subscr, SUBSEP) /p>
p>[chengmo@localhost ~]$ awk 'BEGIN{ /p>
p>for(i=1;i=9;i++)
{
for(j=1;j=9;j++)
{
tarr[i,j]=i*j;
print i,"*",j,"=",tarr[i,j];
}
}
}'
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6 /p>
p>…… /p>
p>可以通過array[k,k2]引用獲得數(shù)組內(nèi)容. /p>
p>方法二: /p>
p>[chengmo@localhost ~]$ awk 'BEGIN{
for(i=1;i=9;i++)
{
for(j=1;j=9;j++)
{
tarr[i,j]=i*j;
}
}
for(m in tarr)
{/p>
p>split(m,tarr2,SUBSEP);
print tarr2[1],"*",tarr2[2],"=",tarr[m];
}
}'
以上是awk對數(shù)組的處理相關(guān),希望對大家有用。