Linux中易混淆的概念

发布于 2020-11-29 更新于 2020-11-30 Linux Linux, shell 0 评论字数统计: 3.6k(字) 阅读时长: 13(分)

温馨提示：点击页面下方以展开或折叠目录

文章说明
文章作者：鴻塵
文章说明：学习Linux shell过程中的记录，参考书籍主要有《Linux命令行与shell脚本编程大全（第3版）》，《鸟哥的Linux私房菜（第三版）》系列和《快乐的 Linux 命令行》，参考资料主要有Linux命令大全等。
文章链接：https://hwame.top/20201129/confusing-concepts-in-linux.html

1.单引号、双引号和反引号

①echo命令可用单引号或双引号来划定文本字符串。如果在字符串中用到了它们，你需要在文本中使用其中一种引号，而用另外一种来将字符串划定起来。

单引号字符串的限制：
- 单引号里的任何字符都会原样输出，单引号字符串中的变量是无效的；
- 单引号字串中不能出现单独一个的单引号（对单引号使用转义符后也不行），但可成对出现，作为字符串拼接使用。
双引号的优点：
- 双引号里可以有变量
- 双引号里可以出现转义字符

②反引号ˋ用于从命令输出中提取信息，将命令输出赋给变量，另一种格式是$()，例如：

注意：赋值等号和命令替换字符之间没有空格。

1 2	testing=`date` testing=$(date)

2.各种括号的作用

本部分各种括号的作用内容参考：shell中各种括号的作用()、(())、[]、[[]]、{}

2.1.小括号/圆括号

单小括号()
- ①命令组。括号中的命令将会新开一个子shell顺序执行，所以括号中的变量不能够被脚本余下的部分使用。括号中多个命令之间用分号隔开，最后一个命令可以没有分号，各命令和括号之间不必有空格。
- ②命令替换。等同于cmd，shell扫描一遍命令行，发现了$( cmd )结构，便将$( cmd )中的cmd执行一次，得到其标准输出，再将此输出放到原来命令。有些shell不支持，如tcsh。
- ③初始化数组。如：array=(a b c d)。
双小括号(( ))
- ①整数扩展。这种扩展计算是整数型的计算，不支持浮点型。((exp))结构扩展并计算一个算术表达式的值，如果表达式的结果为0，那么返回的退出状态码为1（或者是「假」），而一个非零值的表达式所返回的退出状态码将为0（或者是「真」）。若是逻辑判断，表达式exp为真则为1，假则为0。
- ②C语言运算规则。只要括号中的运算符、表达式符合C语言运算规则，都可用在$(( exp ))中，甚至是三目运算符。作不同进位(如二进制、八进制、十六进制)运算时，输出结果全都自动转化成了十进制。如：echo $(( 16#5f ))结果为95(16进位转十进制)。
- ③单纯用 (( )) 也可重定义变量值，比如a=5; (( a++ ))可将$a重定义为6。
- ④常用于算术运算比较，双括号中的变量可以不使用$符号前缀。括号内支持多个表达式用逗号分开。只要括号中的表达式符合C语言运算规则，比如可以直接使用for (( i = 0; i < 5; i++ ))，如果不使用双括号，则为for i in ˋseq 0 4ˋ或者for i in {0..4}。再如可以直接使用if (($i<5))，如果不使用双括号，则为if [ $i -lt 5 ]。

2.2.中括号/方括号

单中括号[]
- ①bash的内部命令，[和test是等同的。如果我们不用绝对路径指明，通常我们用的都是bash自带的命令。if/test结构中的左中括号是调用test的命令标识，右中括号是关闭条件判断的。这个命令把它的参数作为比较表达式或者作为文件测试，并且根据比较的结果来返回一个退出状态码。if/test结构中并不是必须右中括号，但是新版的Bash中要求必须这样。
- ②test和[]中可用的比较运算符只有==和!=，两者都是用于字符串比较的，不可用于整数比较，整数比较只能使用-eq、-gt这种形式。无论是字符串比较还是整数比较都不支持大于号小于号。如果实在想用，对于字符串比较可以使用转义形式，例如：[ ab \< bc ]，结果为真，也就是返回状态为0。[ ]中的逻辑与和逻辑或使用-a和-o表示。
- ③字符范围。用作正则表达式的一部分，描述一个匹配的字符范围，作为test用途的中括号内不能使用正则。
- ④在一个array结构的上下文中，中括号用来引用数组中每个元素的编号。
双中括号[[ ]]
- ①[[是bash程序语言的关键字，并不是一个命令，[[ ]]结构比[ ]结构更加通用。在[[和]]之间所有的字符都不会发生文件名扩展或者单词分割，但是会发生参数扩展和命令替换。
- ②支持字符串的模式匹配，使用=~操作符时甚至支持shell的正则表达式。字符串比较时可以把右边的作为一个模式，而不仅仅是一个字符串，比如[[ hello == hell? ]]，结果为真。[[ ]]中匹配字符串或通配符，不需要引号。
- ③使用[[ ... ]]条件判断结构而非[ ... ]，能够防止脚本中的许多逻辑错误。比如，&&、||、<和>操作符能够正常存在于[[ ]]条件判断结构中，但是如果出现在[ ]结构中的话会报错。比如可以直接使用if [[ $a != 1 && $a != 2 ]]，如果不使用双括号则为if [ $a -ne 1] && [ $a != 2 ]或者if [ $a -ne 1 -a $a != 2 ]。
- ④bash把双中括号中的表达式看作一个单独的元素，并返回一个退出状态码。

2.3.大括号/花括号

⑴常规用法

大括号拓展。通配（globbing）将对大括号中的文件名做扩展。在大括号中，不允许有空白，除非这个空白被引用或转义。
- 第一种：对大括号中的以逗号分割的文件列表进行拓展。如touch {a,b}.txt结果为a.txt b.txt。
- 第二种：对大括号中以点点..分割的顺序文件列表起拓展作用，如：touch {a..d}.txt结果为a.txt b.txt c.txt d.txt。
- 注：在参考文章关于大括号拓展举例中，ls {ex[1-3],ex4}.sh可以扩展，但touch {ex[1-3],ex4}.sh只创建了两个文件。
代码块，又被称为内部组，这个结构事实上创建了一个匿名函数。与小括号中的命令不同，大括号内的命令不会新开一个子shell运行，即脚本余下部分仍可使用括号内变量。括号内的命令间用分号隔开，最后一个也必须有分号。{}的第一个命令和左括号之间必须要有一个空格。

⑵几种特殊的替换结构

①${var:-string}：若变量var为空，则用在命令行中用string来替换${var:-string}；变量var不为空时，则用变量var的值来替换${var:-string}。
②${var:=string}：替换规则和①相同，所不同之处是${var:=string}若var为空时，用string替换${var:=string}的同时还把string赋给变量var。${var:=string}很常用的一种用法是，判断某个变量是否赋值，没有的话则给它赋上一个默认值。
②${var:+string}的替换规则和上面①②相反，即只有当var不是空的时候才替换成string，若var为空时则不替换或者说是替换成变量var即空值。
③${var:?string}替换规则为：若变量var不为空，则用变量var的值来替换${var:?string}；若变量var为空，则把string输出到标准错误中，并从脚本中退出。我们可利用此特性来检查是否设置了变量的值。

补充扩展：在上面的替换结构中string不一定是常值的，可用另外一个变量的值或是一种命令的输出。

⑶四种模式匹配替换结构

模式匹配记忆方法：

#是去掉左边(在键盘上#在$之左边)

%是去掉右边(在键盘上%在$之右边)

#和%中的单一符号是最小匹配，两个相同符号是最大匹配

第一种模式：${variable%pattern}。shell在variable中查找，看它是否以给的模式pattern结尾，如果是，就从命令行把variable中的内容去掉右边最短的匹配模式；
第二种模式：${variable%%pattern}。shell在variable中查找，看它是否以给的模式pattern结尾，如果是，就从命令行把variable中的内容去掉右边最长的匹配模式；
第三种模式：${variable#pattern}。shell在variable中查找，看它是否以给的模式pattern开始，如果是，就从命令行把variable中的内容去掉左边最短的匹配模式；
第四种模式：${variable##pattern}。shell在variable中查找，看它是否以给的模式pattern结尾，如果是，就从命令行把variable中的内容去掉左边最长的匹配模式。

这四种模式中都不会改变variable的值，其中，只有在pattern中使用了*匹配符号时，%和%%、#和##才有区别。结构中的pattern支持通配符，*表示零个或多个任意字符，?表示仅与一个任意字符匹配，[...]表示匹配中括号里面的字符，[!...]表示不匹配中括号里面的字符。

⑷字符串提取和替换

第一种模式：${var:num}。shell在var中提取第num个字符到末尾的所有字符。若num为正数，从左边0处开始；若num为负数，从右边开始提取字串，但必须在冒号后面加空格或一个数字或整个num加上括号，如${var: -2}、${var:1-3}或${var:(-2)}。
第二种模式：${var:num1:num2}。num1是位置，num2是长度。表示从$var字符串的第$num1个位置开始提取长度为$num2的子串。不能为负数。
第三种模式：${var/pattern/pattern}。将var字符串的第一个匹配的pattern替换为另一个pattern。
第四种模式：${var//pattern/pattern}。将var字符串中的所有能匹配的pattern替换为另一个pattern。

2.4.符号`$`后的括号

（1）${a}：变量a的值，在不引起歧义的情况下可以省略大括号。
（2）$(cmd)：命令替换，和cmd效果相同，结果为cmd命令的输出，不过某些Shell版本不支持$()形式的命令替换，如tcsh。
（3）$((expression))：效果和expr expression相同，计算数学表达式expression的数值，其中expression只要符合C语言的运算规则即可，甚至三目运算符和逻辑表达式都可以计算。

2.5.使用括号将多条命令执行

（1）单小括号：(cmd1; cmd2; cmd3)。新开一个子shell顺序执行命令cmd1, cmd2, cmd3，各命令之间用分号隔开，最后一个命令后可以没有分号。
（2）单大括号：{ cmd1; cmd2; cmd3;}。在当前shell顺序执行命令cmd1, cmd2, cmd3，各命令之间用分号隔开，最后一个命令后必须有分号，第一条命令和左括号之间必须用空格隔开。

注意：对{}和()而言，括号中的重定向符只影响该条命令，而括号外的重定向符影响到括号中的所有命令。

3.重定向和管道

输出重定向（>）：将命令的输出发送到一个文件中，其中单大于号（>）会覆盖文件内容，双大于号（>>）用以向文件追加数据。
输入重定向（<）：将文件的内容重定向到命令，与输出重定向正好相反。
内联输入重定向（<<）：输入重定向的另一种方法，这种方法无需使用文件进行重定向，只需要在命令行中指定用于输入重定向的数据就可以了。必须指定一个文本标记来划分输入数据的开始和结尾。任何字符串都可作为文本标记，但在数据的开始和结尾文本标记必须一致。

记忆方法：在命令行上，命令总是在左侧，而重定向符号「指向」数据流动的方向。小于号说明数据正在从输入文件流向命令。
管道（|）：将一个命令的输出作为另一个命令的输入（虽然可以用重定向来实现，但是有些笨拙）。
注意：
- ①不要以为由管道串起的两个命令会依次执行。 Linux系统实际上会同时运行这两个命令，在系统内部将它们连接起来。在第一个命令产生输出的同时，输出会被立即送给第二个命令。数据传输不会用到任何中间文件或缓冲区。
- ②可以在一条命令中使用任意多条管道。

4.退出状态码

shell中运行的每个命令都使用退出状态码（exit status）告诉shell它已经运行完毕。

按照惯例，一个成功结束的命令的退出状态码是0。如果一个命令结束时有错误，退出状态码就是一个正数值。

退出状态码是一个0～255的整数值，在命令结束运行时由命令传给shell，可以使用变量$?捕获这个值（上个已执行命令的退出状态码）并在脚本中使用。
自定义退出状态码（exit n）时，若n超出0~255区间则对256取余。

状态码	描述
`0`	命令成功结束
`1`	一般性未知错误
`2`	不适合的shell命令
`126`	命令不可执行
`127`	没找到命令
`128`	无效的退出参数
`128+x`	与Linux信号`x`相关的严重错误
`130`	通过`Ctrl+C`终止的命令
`255`	正常范围之外的退出状态码

5.待续

文章作者： 鴻塵

本文链接： https://hwame.top/20201129/confusing-concepts-in-linux.html

版权声明： 本博客所有文章除特别声明外，均采用《CC BY 4.0 CN协议》许可协议。转载请注明出处！

鴻塵Pythoner, Data Analyst

个人简介：处女座不适合做码农。