linuxgawk命令 linux常用命令grep awk sed

Linux入门系列——awk命令详解

awk是一个强大的文本分析工具,与grep、sed相比,awk在对数据分析并生成报告时,显得有很大的优势。

创新互联公司专注为客户提供全方位的互联网综合服务,包含不限于网站设计制作、网站建设、开原网络推广、小程序制作、开原网络营销、开原企业策划、开原品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等,从售前售中售后,我们都将竭诚为您服务,您的肯定,是我们最大的嘉奖;创新互联公司为所有大学生创业者提供开原建站搭建服务,24小时服务热线:13518219792,官方网址:www.cdcxhl.com

awk有三个不同的版本:awk、nawk和gawk,在没有做特殊说时的时候默认的就是gawk,gawk是awk的GNU版本。

其中command是真正的awk命令,-F表示域的分隔符,是个可选项。Filename是等待处理的文件

将所有的awk命令写入到一个文件,并使用该文件有X权限,然后awk命令解释器作为脚本的首行,也就是说可以把脚本最开始的 #!/bin/bash 换成 #!/bin/awk

最后直接执行这个脚本文件就行了。

-f 指定要加载的awk脚本,是一个文件。Filename是等待处理的文件

awk的工作流程是这样的:读入一行后(最后面带有” ”的),就按-F指定的分隔符来将该行划分成N个区域,$0表示所有的区域,$1表示第一个域,$2表示第二个域,依此类推,$n表示第n个域。

总结:awk先执行BEGIN内的命令,然后再读入文件中的行,接着就是按照指定的分隔符将该行分成N个区域,然后再来执行模式所对应的动作action。然后,再来读入第二行。。再重复执行action,直到所有的行都处理完成。最后再执行END中的命令。

注意:' // '之间是支持正则表达式的,如果此处只有pattern,而没有action,那么awk默认会把匹配到的行打印出来。

awk中的print还可以使用C语言中的printf来替代。在输出格式比较复杂的时候使用printf函数会比print函数要更直观一些,如下:

还可以使用-v key=value来自定义变量。如下:

awk中的条件语句是从C中借鉴过来的

语法:if (condition) {then-body} else {else-body}

例如使用awk来统计某个目录下的普通文件的大小,不包括子目录的,并过滤掉目录。

循环语句也和C中的一样,支持while、do/while、for、continue、break等关键字。

break和continue常用于循环中;

在awk中,数组的下标可以是数字或字母。一般awk中的数组的作用是从记录中收集信息,用于计算总和、统计单词等。

在awk中要删除一个元素的时候使用 delete array[index]

更多请参见awk官方文档[]

gawk 使用方法简介

其功能与特性包括:

gawk options program file

构成 gawk 脚本的语句须包含在一对 大括号 ( {} )中,而作为命令选项的整个脚本需要包含在一对 引号 中:

gawk 会自动地将每行文本中的每个 数据字段 赋值给一个指定的变量,默认情况下,预先定义的变量为:

文本行中的数据字段是通过预先定义的 字段分隔符 来分隔开的,默认为 空格 (包括 TAB )

gawk 语言允许在脚本语句中组合多个命令使用,只需要在各命令之间使用 分号 ( ; )分隔开即可

也可以这样:

其中 My name is Rich 是运行时程序获取的用户输入,My name is Christine 是程序运行后的输出

默认情况下,gawk 从输入中读取一行文本,再对该文本执行程序指令。而有时候需要在读取待处理数据之前先执行某些指令,此时就要用到 BEGIN 关键字。

同样的, END 关键字允许你指定在数据处理完成后才执行的脚本。

gawk 允许先将其程序脚本保存在某个文件中,再通过 -f 选项指定该文件的文件名。而在脚本文件中,各命令不再需要通过 ';' 符号分隔,直接分行列出即可。

程序语言最重要的特性之一就是定义和引用 变量 。gawk 语言支持两种类型的变量:内建变量和用户自定义变量。

gawk 程序在处理文本数据时,一次只读取一小段文本,称为 Record 。默认的 Record 分隔符即为换行符。而每条 Record 又可进一步划分成 字段 (Data Field),并按顺序依次赋值给 $1,$2,$n 等。默认的字段分隔符为空格(包括 TAB)

默认的 OFS 为空格

当定义了 FIELDWIDTHS 变量时,gawk 在读取数据时就会忽略字段分割符(FS),转而使用 字段宽度 来分割数据。

有些时候会遇到如下组织方式的文本文件:

此时可将字段分隔符(FS)设置为 "\n",Record 分隔符(RS)设置为空字符串,则 gawk 程序会将 空行 作为一条 Record 的终止点。

ARGV 的索引是从 0 开始的,表示第一个命令行参数(呃,所以通常就是 gawk 这个命令本身)。程序脚本(引号中的内容)不算在参数内。

定义数组: var[index]=element

遍历数组:

匹配符(~)用来对 Record 中的特定字段使用正则表达式。 !~ 表示不匹配。

if (condition) statement

for( variable assignment; condition; iteration process)

printf 命令格式: printf "format string", var1, var2 . . .

常用格式控制符如下表所示:

除 控制字符 以外,还可以使用另外三种修饰符以对输出进行更多的控制。

参考下面的示例, %10.1f 中的 10 用于指定字段的最小宽度(右对齐,前面用空格补), .1 用于指定精确度。

定义函数

使用函数

函数库

创建函数库

调用函数库

Linux Command Line and Shell Scripting Bible 3rd Edition

linux awk命令怎么用?

linux awk命令怎么用? awk:用于一行中分成数个“栏位”来处理。适合处理 小型资料。

执行模式:awk '条件型别1{动作1} 条件型别2{动作2} ...' filename

# last | awk '{print $1 "\t" $3}' == 检视登入者的资料,只显示登入名和ip地址,并以[tab]隔开

awk 的内建变数

变数名称 代表的含义

NF 每一行($0)拥有的栏位总数

NR 当前 awk 所处理的是 “第几行” 资料

FS 当前分隔符,预设空格键

awk 的逻辑运算子

运算单元 代表含义

大于

小于

= 大于或等于

= 小于或等于

== 等于

!= 不等于

范例:

cat /etc/passwd | awk '{FS=":"} $3 10 {print $1 "\t" $3}' == 档案/etc/passwd是以":"分隔的,检视第三栏小于10的资料,并且只显示帐号与第三栏

以上是我对awk的总结,希望对你有帮助,是我写的哦,不是复制的。

linux 怎么用awk命令 取出一段文字

awk '/DIMENSION NAME="CCCCCC" SRC_TYPE="INTERNAL"/,/DIMENSIONS/ {print $0}' filename

Linux awk命令问题

head -n 3 /etc/passwd|awk -F ':' '$1="root"' 这里$1="root",表示将第1列的值赋值为root,因此上述命令表示:将/etc/passwd中前3行按照‘:’分隔后第一列以root显示,并列印其他列。

awk -F ':' '$3=="0"' /etc/passwd

这里$3=="0",表示将第三列与"0”进行匹配,以什么方式匹配呢?以‘:’分隔后的第三列进行匹配并列印。这里是匹配列印,所以列印的是匹配的那一行(被:分隔后),而不是显示分隔后的列。

所以,区别在于一个是分隔后赋值列印分隔后列的值,一个是按照指定分隔方式进行匹配找到匹配的行,列印的是匹配的那一行。

linux的awk命令问题

一行里 第一个元素和第三个元素

linux下 awk命令问题

1、其实这样基本满足要求。但是确实不够严谨。试试是否可以。

ps -le | grep sshd | awk '{print $4}'

2、对ps 命令用的最多的是ps -ef 对el 我不是很了解具体输出什么。当然,是不是你压根就没有这个sshd服务启动。这些都先验证一下。一步一步的输出,看看问题出现在管道的哪一个环节。

3、或者这个 $14==sshd 栏位你指定错了。 awk $指定的变数是从1 开始的。$0是整个行。这个不要忘记了哦。

如果上述1第一种情况可以输出,第二种2不可以话,可能就验证了我的假设。你栏位拆解出现错误。把$14 这个栏位好好看看。

linux awk命令基础 怎么在终端写

awk一般用于文字处理,通常用作资料提取。终端书写demo

awk '{print }' info.txt

以上是输出文字档案info.txt的所有内容,请使用实际档案进行替换info.txt

ps -ef|grep process_name | awk -F"" '{print $2}'

以上是查询process_name程序的ID资讯,把查询资讯作为引数传给awk进行过滤,请使用实际程序名替换process_name。

awk命令在 linux和aix下的区别

三种呼叫awk的命令方式:

1.命令列方式:awk [-F field-separator] 'mands' input-file(s)

-F选项可选:awk -F: 'mands' input-file

2.将所有的awk命令插入一个档案,并是awk程式可执行,然后用awk命令直译器作为指令码的首行,

以便通过键入指令码名称来呼叫它。

3.将所有的awk命令插入一个单独档案,然后呼叫:

awk -f awk-script-file input-files(s)

-f:指明在档案awk-script-file中的awk指令码

input-file(s):使用awk进行浏览的档名。

awk指令码

在命令中呼叫awk时,awk指令码由各种操作和模式组成。

-F,awk每次读一条记录或一行,并使用指定的分隔符分分隔指定域;

所没分隔符,则使用空格。

任何awk语句都由模式和动作组成

模式,决定动作语句何时触发及触发事件,若忽略模式部分,动作将时刻保持执行状态。

模式,可是任何条件语句,或符合语句,或正则表示式。

BEGIN:设定计数,列印头,在任何文字浏览动作之前;

END:用来在awk完成档案浏览动作后列印输出档案总数和结尾状态标志。

动作,在{}内指定;大多用来列印;里面可包含:if,looping,回圈推出结构;

若不指明采取动作,awk将列印所有浏览出来的记录。

如何在Linux中使用awk命令

awk例项

1、cat /etc/passwd|awk -F: '{print $1}'

2、linux的awk一般都是gawk,/bin/awk - gawk

3、awk ‘/abc/’ file.txt 显示档案中包含abc行。类似grep abc a.txt

4、awk ‘{print NR,NF,$1,$NF,}’ file.txt按空格分隔列,显示当前记录号、域数和每一行的第一列和最后一列。

-F引数可以设定分割引数,例如按:分割

awk -F: ‘{print $1}’ /etc/passwd

或者cat file|awk -F “|” ‘{print $1}’

5、awk程式语言

cat v.txt|awk ‘{print length($1)}’

6、awk中使用NR和FNR,一般在awk处理多个档案时,NR==FNR才有意义

NF 当前记录中的栏位数。

NR 当前记录数。

FNR同NR,但相对于当前档案。

awk ‘{print NR,FNR}’ test.txt test2.txt

awk ‘{if(NR==FNR){a[FNR]=$1;}else{print $1,a[FNR]}}’ b.txt a.txt

7、列印奇数行与偶数行

awk ‘NR%2’ test.txt

awk ‘!(NR%2)’ test.txt

8、杀死tomcat的s.sh指令码

#!/bin/sh

ps -ef| grep tomcat |grep -v grep | awk ‘{print $2}’ |xargs kill -9

9、列印前7列

cat a.txt|awk ‘{NF=7}1’ b.txt

tail -f aess.log|awk ‘NF=7′ OFS=’\t’ b.txt

cut -d”,” -f3-6 urfile

LINUX系统怎么使用awk命令实现下述操作

cat file|awk -F"name=" '{print $2}'|awk -F\" '{print $1}'

试试看,第二个”的转义,我没测试,可以自己调下


当前题目:linuxgawk命令 linux常用命令grep awk sed
文章路径:http://myzitong.com/article/ddiopeo.html