Linux中易混淆的概念

温馨提示:点击页面下方以展开或折叠目录

文章说明
文章作者:鴻塵
文章说明:学习Linux shell过程中的记录,参考书籍主要有《Linux命令行与shell脚本编程大全(第3版)》,《鸟哥的Linux私房菜(第三版)》系列和《快乐的 Linux 命令行》,参考资料主要有Linux命令大全等。
文章链接:https://hwame.top/20201129/confusing-concepts-in-linux.html

1.单引号、双引号和反引号

echo命令可用单引号或双引号来划定文本字符串。如果在字符串中用到了它们,你需要在文本中使用其中一种引号,而用另外一种来将字符串划定起来。

  • 单引号字符串的限制:
    • 单引号里的任何字符都会原样输出,单引号字符串中的变量是无效的;
    • 单引号字串中不能出现单独一个的单引号(对单引号使用转义符后也不行),但可成对出现,作为字符串拼接使用。
  • 双引号的优点:
    • 双引号里可以有变量
    • 双引号里可以出现转义字符

反引号ˋ用于从命令输出中提取信息,将命令输出赋给变量,另一种格式是$(),例如:

注意:赋值等号和命令替换字符之间没有空格。

1
2
testing=`date`
testing=$(date)

2.各种括号的作用

本部分各种括号的作用内容参考:shell中各种括号的作用()、(())、[]、[[]]、{}

2.1.小括号/圆括号

  • 单小括号()
    • 命令组。括号中的命令将会新开一个子shell顺序执行,所以括号中的变量不能够被脚本余下的部分使用。括号中多个命令之间用分号隔开,最后一个命令可以没有分号,各命令和括号之间不必有空格。
    • 命令替换。等同于cmd,shell扫描一遍命令行,发现了$( cmd )结构,便将$( cmd )中的cmd执行一次,得到其标准输出,再将此输出放到原来命令。有些shell不支持,如tcsh。
    • 初始化数组。如:array=(a b c d)
  • 双小括号(( ))
    • 整数扩展。这种扩展计算是整数型的计算,不支持浮点型。((exp))结构扩展并计算一个算术表达式的值,如果表达式的结果为0,那么返回的退出状态码为1(或者是「假」),而一个非零值的表达式所返回的退出状态码将为0(或者是「真」)。若是逻辑判断,表达式exp为真则为1,假则为0
    • C语言运算规则。只要括号中的运算符、表达式符合C语言运算规则,都可用在$(( exp ))中,甚至是三目运算符。作不同进位(如二进制、八进制、十六进制)运算时,输出结果全都自动转化成了十进制。如:echo $(( 16#5f ))结果为95(16进位转十进制)。
    • ③单纯用 (( )) 也可重定义变量值,比如a=5; (( a++ ))可将$a重定义为6
    • ④常用于算术运算比较,双括号中的变量可以不使用$符号前缀。括号内支持多个表达式用逗号分开。 只要括号中的表达式符合C语言运算规则,比如可以直接使用for (( i = 0; i < 5; i++ )),如果不使用双括号,则为for i in ˋseq 0 4ˋ或者for i in {0..4}。再如可以直接使用if (($i<5)),如果不使用双括号,则为if [ $i -lt 5 ]

2.2.中括号/方括号

  • 单中括号[]
    • ①bash的内部命令[test是等同的。如果我们不用绝对路径指明,通常我们用的都是bash自带的命令。if/test结构中的左中括号是调用test的命令标识,右中括号是关闭条件判断的。这个命令把它的参数作为比较表达式或者作为文件测试,并且根据比较的结果来返回一个退出状态码。if/test结构中并不是必须右中括号,但是新版的Bash中要求必须这样。
    • test[]中可用的比较运算符只有==!=,两者都是用于字符串比较的,不可用于整数比较,整数比较只能使用-eq-gt这种形式。无论是字符串比较还是整数比较都不支持大于号小于号。如果实在想用,对于字符串比较可以使用转义形式,例如:[ ab \< bc ],结果为真,也就是返回状态为0[ ]中的逻辑与和逻辑或使用-a-o表示。
    • 字符范围。用作正则表达式的一部分,描述一个匹配的字符范围,作为test用途的中括号内不能使用正则。
    • ④在一个array结构的上下文中,中括号用来引用数组中每个元素的编号
  • 双中括号[[ ]]
    • [[是bash程序语言的关键字,并不是一个命令,[[ ]]结构比[ ]结构更加通用。在[[]]之间所有的字符都不会发生文件名扩展或者单词分割,但是会发生参数扩展和命令替换。
    • ②支持字符串的模式匹配,使用=~操作符时甚至支持shell的正则表达式。字符串比较时可以把右边的作为一个模式,而不仅仅是一个字符串,比如[[ hello == hell? ]],结果为真。[[ ]]中匹配字符串或通配符,不需要引号。
    • ③使用[[ ... ]]条件判断结构而非[ ... ],能够防止脚本中的许多逻辑错误。比如,&&||<>操作符能够正常存在于[[ ]]条件判断结构中,但是如果出现在[ ]结构中的话会报错。比如可以直接使用if [[ $a != 1 && $a != 2 ]],如果不使用双括号则为if [ $a -ne 1] && [ $a != 2 ]或者if [ $a -ne 1 -a $a != 2 ]
    • ④bash把双中括号中的表达式看作一个单独的元素,并返回一个退出状态码。

2.3.大括号/花括号

⑴常规用法

  • 大括号拓展。通配(globbing)将对大括号中的文件名做扩展。在大括号中,不允许有空白,除非这个空白被引用或转义。
    • 第一种:对大括号中的以逗号分割的文件列表进行拓展。如touch {a,b}.txt结果为a.txt b.txt
    • 第二种:对大括号中以点点..分割的顺序文件列表起拓展作用,如:touch {a..d}.txt结果为a.txt b.txt c.txt d.txt
    • 注:在参考文章关于大括号拓展举例中,ls {ex[1-3],ex4}.sh可以扩展,但touch {ex[1-3],ex4}.sh只创建了两个文件。
  • 代码块,又被称为内部组,这个结构事实上创建了一个匿名函数。与小括号中的命令不同,大括号内的命令不会新开一个子shell运行,即脚本余下部分仍可使用括号内变量。括号内的命令间用分号隔开,最后一个也必须有分号。{}的第一个命令和左括号之间必须要有一个空格。

⑵几种特殊的替换结构

  • ${var:-string}:若变量var为空,则用在命令行中用string来替换${var:-string};变量var不为空时,则用变量var的值来替换${var:-string}
  • ${var:=string}:替换规则和①相同,所不同之处是${var:=string}var为空时,用string替换${var:=string}的同时还把string赋给变量var${var:=string}很常用的一种用法是,判断某个变量是否赋值,没有的话则给它赋上一个默认值。
  • ${var:+string}的替换规则和上面①②相反,即只有当var不是空的时候才替换成string,若var为空时则不替换或者说是替换成变量var即空值。
  • ${var:?string}替换规则为:若变量var不为空,则用变量var的值来替换${var:?string};若变量var为空,则把string输出到标准错误中,并从脚本中退出。我们可利用此特性来检查是否设置了变量的值。

补充扩展:在上面的替换结构中string不一定是常值的,可用另外一个变量的值或是一种命令的输出。

⑶四种模式匹配替换结构

模式匹配记忆方法:

  • #是去掉左边(在键盘上#在$之左边)
  • %是去掉右边(在键盘上%在$之右边)
  • #%中的单一符号是最小匹配,两个相同符号是最大匹配
  • 第一种模式:${variable%pattern}。shell在variable中查找,看它是否以给的模式pattern结尾,如果是,就从命令行把variable中的内容去掉右边最短的匹配模式;
  • 第二种模式:${variable%%pattern}。shell在variable中查找,看它是否以给的模式pattern结尾,如果是,就从命令行把variable中的内容去掉右边最长的匹配模式;
  • 第三种模式:${variable#pattern}。shell在variable中查找,看它是否以给的模式pattern开始,如果是,就从命令行把variable中的内容去掉左边最短的匹配模式;
  • 第四种模式:${variable##pattern}。shell在variable中查找,看它是否以给的模式pattern结尾,如果是,就从命令行把variable中的内容去掉左边最长的匹配模式。

这四种模式中都不会改变variable的值,其中,只有在pattern中使用了*匹配符号时,%%%###才有区别。结构中的pattern支持通配符,*表示零个或多个任意字符,?表示仅与一个任意字符匹配,[...]表示匹配中括号里面的字符,[!...]表示不匹配中括号里面的字符 。

⑷字符串提取和替换

  • 第一种模式:${var:num}。shell在var中提取第num个字符到末尾的所有字符。若num为正数,从左边0处开始;若num为负数,从右边开始提取字串,但必须在冒号后面加空格或一个数字或整个num加上括号,如${var: -2}${var:1-3}${var:(-2)}
  • 第二种模式:${var:num1:num2}num1是位置,num2是长度。表示从$var字符串的第$num1个位置开始提取长度为$num2的子串。不能为负数。
  • 第三种模式:${var/pattern/pattern}。将var字符串的第一个匹配pattern替换为另一个pattern
  • 第四种模式:${var//pattern/pattern}。将var字符串中的所有能匹配pattern替换为另一个pattern

2.4.符号$后的括号

  • (1)${a}:变量a的值,在不引起歧义的情况下可以省略大括号。
  • (2)$(cmd):命令替换,和cmd效果相同,结果为cmd命令的输出,不过某些Shell版本不支持$()形式的命令替换,如tcsh。
  • (3)$((expression)):效果和expr expression相同,计算数学表达式expression的数值,其中expression只要符合C语言的运算规则即可,甚至三目运算符和逻辑表达式都可以计算。

2.5.使用括号将多条命令执行

  • (1)单小括号:(cmd1; cmd2; cmd3)。新开一个子shell顺序执行命令cmd1, cmd2, cmd3,各命令之间用分号隔开,最后一个命令后可以没有分号。
  • (2)单大括号:{ cmd1; cmd2; cmd3;}。在当前shell顺序执行命令cmd1, cmd2, cmd3,各命令之间用分号隔开,最后一个命令后必须有分号,第一条命令和左括号之间必须用空格隔开。

注意:{}()而言,括号中的重定向符只影响该条命令, 而括号外的重定向符影响到括号中的所有命令。

3.重定向和管道

  • 输出重定向(>):将命令的输出发送到一个文件中,其中单大于号(>)会覆盖文件内容,双大于号(>>)用以向文件追加数据。
  • 输入重定向(<):将文件的内容重定向到命令,与输出重定向正好相反。
  • 内联输入重定向(<<):输入重定向的另一种方法,这种方法无需使用文件进行重定向,只需要在命令行中指定用于输入重定向的数据就可以了。必须指定一个文本标记来划分输入数据的开始和结尾。任何字符串都可作为文本标记,但在数据的开始和结尾文本标记必须一致。

    记忆方法:在命令行上,命令总是在左侧,而重定向符号「指向」数据流动的方向。小于号说明数据正在从输入文件流向命令。

  • 管道(|):将一个命令的输出作为另一个命令的输入(虽然可以用重定向来实现,但是有些笨拙)。

    注意:

    • 不要以为由管道串起的两个命令会依次执行。 Linux系统实际上会同时运行这两个命令,在系统内部将它们连接起来。在第一个命令产生输出的同时,输出会被立即送给第二个命令。数据传输不会用到任何中间文件或缓冲区。
    • 可以在一条命令中使用任意多条管道。

4.退出状态码

shell中运行的每个命令都使用退出状态码(exit status)告诉shell它已经运行完毕。

按照惯例,一个成功结束的命令的退出状态码是0。如果一个命令结束时有错误,退出状态码就是一个正数值。

退出状态码是一个0~255的整数值,在命令结束运行时由命令传给shell,可以使用变量$?捕获这个值(上个已执行命令的退出状态码)并在脚本中使用。
自定义退出状态码(exit n)时,若n超出0~255区间则对256取余。

状态码 描述
0 命令成功结束
1 一般性未知错误
2 不适合的shell命令
126 命令不可执行
127 没找到命令
128 无效的退出参数
128+x 与Linux信号x相关的严重错误
130 通过Ctrl+C终止的命令
255 正常范围之外的退出状态码

5.待续