如何在awk中初始化数组
awk的数组其实很好理解。一般编程语言的数组,其下标只能是数字,比如a[3],表示数组a的第四个元素。
但是awk的不同,其下标可以是任意字符或者字符串。比如a[bob],表示数组a的一个元素,它的下标是"bob"。
比如有个文本文件alex.txt:
a 1
b 2
c 3
a 4
b 5
a 6
如果我们想统计以a开头的行后面的数字之和,就是“1+4+6”,我们用awk怎么做呢:
cat alex.txt | awk ‘{if(!arr***[$1]) {arr***[$1]=$2;}
elae{arrary[$1]=arr***[$1]+$2;}}END{print arr***[a];}’
命令中有个数组arr***,当读取alex.txt***行时,$1是“a”,arr***[a]刚开始是“”(空字符串),所以!arr***[a]就为真,那么arr***[a]=1,数组arr***就有了***个元素arr***[a].
同理,读取第二行之后结果arr***[a]=1, arr***[b]=2,数组arr***就有了2个元素。
第三行之后结果是arr***[a]=1, arr***[b]=2, arr***[c]=3,数组arr***就有了3个元素。
第四行之后结果是arr***[a]=5(1+4,4为第四行的$2), arr***[b]=2, arr***[c]=3
第五行之后结果是arr***[a]=5, arr***[b]=7, arr***[c]=3
第六行之后结果是arr***[a]=11, arr***[b]=7, arr***[c]=3
END的意思是读取完文件所有行后执行的语句,打印出数组***个元素arr***[a].
AWK的使用
AWK
语法: awk -F/f/v/ + ‘pattern’ +文件全路径
或者:标准输出|awk -F/f/v/ + ‘pattern’
参数含义: -F 指定域的分隔符,如默冒号“:”
写法有三个
1.awk -F: ‘pattern’ 文件全路径
2.awk -F “:” ‘pattern’ 文件全路径
3.awk -F’[:,t]’ ‘pattern’ 文件全路径 #这里用单引号+中括号,表示分隔字符的集合,集合中的每一个符号都会被用作分隔符去分隔当前行
-f 指定从awk文件中执行awk指令
awk是一门语言,它有自己的语法,如果在考虑复用已经awk语句比较复杂的情况下,建议将其写入文件。文件尾建议定为.awk的后缀。
在awk脚本文件的***行,写入命令解释器的位置,所以这里要写入awk解释器的路劲
终端执行 which awk 命令得到位置
一般为 /usr/bin/awk
于是,文件开头写为 #!/usr/bin/awk -f
然后就在下一行写你的awk语句,保存退出。
这么执行 awk -f script.awk file
-v 自定义变量
awk -v var="name" 'BEGIN{print var}'
感觉没什么用,如果要定义变量,不如直接定义在BEGIN里面
awk -F: ‘BEGIN{var=”name”}{print var}END{print “balabalaba”}’ file
awk 可以使用条件判断、for、do-while等控制语句
语法都和C语言近似,如有需要请看这里
awk 的print 语句支持格式控制,和C类似 ,
语法为: print “balabal %-6s balabala %dn”,name,age
%s,控制字符串类型输出
%d,控制整形类型输出
%f,控制浮点型
%%,转义为%号
awk存在数组数据类型
数组也和变量一样,初始化语句也同时是声明语句,arr[110]=”aaa”,arr[nihao] = 123,
可以看出来,awk的数组其实并不是正真意义上的数组,更像一个字典
awk内置变量
(一)FS:字段分隔符(field separator) #设置域分隔字符,是用某个字符的替换之前的内容
(二)OFS:输出的字段分隔符(output field separator)#替换FS的内容
(三)RS:记录分隔符(record separator) #设置换行符,使某个字符后面的内容换到下一行
(四)ORS:输出的记录分隔符(output record separator)#将换行符替换成ORS的内容
(五)NF:字段数量(number of field)
这里 (NF-1)可以取到倒数第二个域的值
(六)NR:记录编号(number of record)#行号
(七)FNR:按文件计算“记录编号”(file (1)FNR 表示当前行在不同输入流中处于第几行 #用同一个AWk处理多个文件时,正确显示改行在文件中的行号
(八)FILENAME:文件名
(九)ARGC:参数个数(arguments account)
(十)ARGV:参数列表数组(arguments variable)
Linux awk 命令详解(二) if 分支 数组
一、awk if分支结构
二、awk数组 for循环
一、awk if分支结构
案例1
awk过滤中的if分支结构
1)单分支
统计/etc/passwd文件中UID小于或等于1000的用户个数:
统计/etc/passwd文件中UID大于1000的用户个数:
统计/etc/passwd文件中登录Shell是“/bin/bash”的用户个数:
2)双分支
分别统计/etc/passwd文件中UID小于或等于1000、UID大于1000的用户个数:
分别统计/etc/passwd文件中登录Shell是“/bin/bash”、 登录Shell不是“/bin/bash”的用户个数:
二、awk数组
注意,awk数组的下标除了可以使用数字,也可以使用字符串,字符串需要使用双引号:
案例3:awk扩展应用
1)awk统计Web访问排名
在分析Web日志文件时,每条访问记录的***列就是客户机的IP地址,其中会有很多重复的IP地址。因此只用awk提取出这一列是不够的,还需要统计重复记录的数量并且进行排序。
通过awk提取信息时,利用IP地址作为数组下标,每遇到一个重复值就将此数组元素递增1,最终就获得了这个IP地址出现的次数。
针对文本排序输出可以采用sort命令,相关的常见选项为-r、-n、-k。其中-n表示按数字顺序升序排列,而-r表示反序,-k可以指定按第几个字段来排序
实现此案例需要按照如下步骤进行。
步骤一:统计Web访问量排名
分步测试、验证效果如下所述。
1)提取IP地址及访问量
2)对第1)步的结果根据访问量排名
案例4:编写监控脚本
本案例要求编写脚本,实现计算机各个性能数据监控的功能,具体监控项目要求如下:
CPU负载
网卡流量
内存剩余容量
磁盘剩余容量
计算机账户数量
当前登录账户数量
计算机当前开启的进程数量
本机已安装的软件包数量
步骤
实现此案例需要按照如下步骤进行。
步骤一:准备工作
1)查看性能数据的命令
步骤二:编写参考脚本
1)脚本内容如下:
关于awk数组和awk数组打印for循环的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。