awk数组、awk数组打印for循环_生活资讯_资讯

awk数组、awk数组打印for循环

2023-04-09 00:32 浏览:26

如何在awk中初始化数组

awk的数组其实很好理解。一般编程语言的数组，其下标只能是数字，比如a[3]，表示数组a的第四个元素。

但是awk的不同，其下标可以是任意字符或者字符串。比如a[bob]，表示数组a的一个元素，它的下标是"bob"。

比如有个文本文件alex.txt:

a 1

b 2

c 3

a 4

b 5

a 6

如果我们想统计以a开头的行后面的数字之和，就是“1+4+6”，我们用awk怎么做呢：

cat alex.txt | awk ‘{if(!arr***[$1]) {arr***[$1]=$2;}

elae{arrary[$1]=arr***[$1]+$2;}}END{print arr***[a];}’

命令中有个数组arr***，当读取alex.txt***行时，$1是“a”，arr***[a]刚开始是“”（空字符串），所以!arr***[a]就为真，那么arr***[a]=1，数组arr***就有了***个元素arr***[a].

同理，读取第二行之后结果arr***[a]=1, arr***[b]=2，数组arr***就有了2个元素。

第三行之后结果是arr***[a]=1, arr***[b]=2, arr***[c]=3，数组arr***就有了3个元素。

第四行之后结果是arr***[a]=5（1+4，4为第四行的$2）, arr***[b]=2, arr***[c]=3

第五行之后结果是arr***[a]=5, arr***[b]=7, arr***[c]=3

第六行之后结果是arr***[a]=11, arr***[b]=7, arr***[c]=3

END的意思是读取完文件所有行后执行的语句，打印出数组***个元素arr***[a].

AWK的使用

AWK

语法: awk -F/f/v/ + ‘pattern’ +文件全路径

或者:标准输出|awk -F/f/v/ + ‘pattern’

参数含义： -F 指定域的分隔符，如默冒号“:”

写法有三个

1.awk -F: ‘pattern’ 文件全路径

2.awk -F “:” ‘pattern’ 文件全路径

3.awk -F’[:,t]’ ‘pattern’ 文件全路径 #这里用单引号+中括号，表示分隔字符的集合，集合中的每一个符号都会被用作分隔符去分隔当前行

-f 指定从awk文件中执行awk指令

awk是一门语言，它有自己的语法，如果在考虑复用已经awk语句比较复杂的情况下，建议将其写入文件。文件尾建议定为.awk的后缀。

在awk脚本文件的***行，写入命令解释器的位置，所以这里要写入awk解释器的路劲

终端执行 which awk 命令得到位置

一般为 /usr/bin/awk

于是，文件开头写为 #!/usr/bin/awk -f

然后就在下一行写你的awk语句，保存退出。

这么执行 awk -f script.awk file

-v 自定义变量

awk -v var="name" 'BEGIN{print var}'

感觉没什么用，如果要定义变量，不如直接定义在BEGIN里面

awk -F: ‘BEGIN{var=”name”}{print var}END{print “balabalaba”}’ file

awk 可以使用条件判断、for、do-while等控制语句

语法都和C语言近似，如有需要请看这里

awk 的print 语句支持格式控制,和C类似，

语法为： print “balabal %-6s balabala %dn”,name,age

%s,控制字符串类型输出

%d,控制整形类型输出

%f,控制浮点型

%%，转义为%号

awk存在数组数据类型

数组也和变量一样，初始化语句也同时是声明语句，arr[110]=”aaa”，arr[nihao] = 123,

可以看出来，awk的数组其实并不是正真意义上的数组，更像一个字典

awk内置变量

（一）FS：字段分隔符（field separator） #设置域分隔字符，是用某个字符的替换之前的内容

（二）OFS：输出的字段分隔符（output field separator）#替换FS的内容

（三）RS：记录分隔符（record separator） #设置换行符，使某个字符后面的内容换到下一行

（四）ORS：输出的记录分隔符（output record separator）#将换行符替换成ORS的内容

（五）NF：字段数量（number of field）

这里 (NF-1)可以取到倒数第二个域的值

（六）NR：记录编号（number of record）#行号

（七）FNR：按文件计算“记录编号”（file （1）FNR 表示当前行在不同输入流中处于第几行 #用同一个AWk处理多个文件时，正确显示改行在文件中的行号

（八）FILENAME：文件名

（九）ARGC：参数个数（arguments account）

（十）ARGV：参数列表数组（arguments variable）

Linux awk 命令详解(二) if 分支数组

一、awk if分支结构

二、awk数组 for循环

一、awk if分支结构

案例1

awk过滤中的if分支结构

1）单分支

统计/etc/passwd文件中UID小于或等于1000的用户个数：

统计/etc/passwd文件中UID大于1000的用户个数：

统计/etc/passwd文件中登录Shell是“/bin/bash”的用户个数：

2）双分支

分别统计/etc/passwd文件中UID小于或等于1000、UID大于1000的用户个数：

分别统计/etc/passwd文件中登录Shell是“/bin/bash”、登录Shell不是“/bin/bash”的用户个数：

二、awk数组

注意，awk数组的下标除了可以使用数字，也可以使用字符串，字符串需要使用双引号：

案例3：awk扩展应用

1）awk统计Web访问排名

在分析Web日志文件时，每条访问记录的***列就是客户机的IP地址，其中会有很多重复的IP地址。因此只用awk提取出这一列是不够的，还需要统计重复记录的数量并且进行排序。

通过awk提取信息时，利用IP地址作为数组下标，每遇到一个重复值就将此数组元素递增1，最终就获得了这个IP地址出现的次数。

针对文本排序输出可以采用sort命令，相关的常见选项为-r、-n、-k。其中-n表示按数字顺序升序排列，而-r表示反序，-k可以指定按第几个字段来排序

实现此案例需要按照如下步骤进行。

步骤一：统计Web访问量排名

分步测试、验证效果如下所述。

1）提取IP地址及访问量

2）对第1）步的结果根据访问量排名

案例4：编写监控脚本

本案例要求编写脚本，实现计算机各个性能数据监控的功能，具体监控项目要求如下：

CPU负载

网卡流量

内存剩余容量

磁盘剩余容量

计算机账户数量

当前登录账户数量

计算机当前开启的进程数量

本机已安装的软件包数量

步骤

实现此案例需要按照如下步骤进行。

步骤一：准备工作

1）查看性能数据的命令

步骤二：编写参考脚本

1）脚本内容如下：

关于awk数组和awk数组打印for循环的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

打赏

如何在awk中初始化数组

AWK的使用

Linux awk 命令详解(二) if 分支 数组

Linux awk 命令详解(二) if 分支数组