目次
PowerShellでの正規表現の使い方について
今回は、PowerShellでの正規表現の使い方について説明します。正規表現の判定・マッチした部分の抽出/置換方法について紹介します。
PowerShellでの正規表現の使い方に興味のある方はぜひご覧ください。
判定
PowerShellでの正規表現を使った文字列の判定方法を紹介します。
文字列が正規表現にマッチするか否かということです。
実際のコマンドを見てみましょう。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
PS C:\> # "test"で始まる
PS C:\> "test123" -match "^test"
True
PS C:\> # "test"で始まり、数字が0個以上続く
PS C:\> "test123" -match "^test[0-9]*"
True
PS C:\> # 小文字アルファベット0文字以上で始まり、数字が0個以上続く
PS C:\> "test123" -match "^[a-z]*[0-9]*"
True
PS C:\> # 小文字アルファベット0文字以上で始まり、終わる
PS C:\> "test123" -match "^[a-z]*$"
False
PS C:\> # 数字0個以上で終わる
PS C:\> "test123" -match "[0-9]*$"
True
PS C:\> # 数字3つの繰り返しを含む
PS C:\> "test123" -match "[0-9]{3}"
True
PS C:\> # 7文字
PS C:\> "test123" -match ".{7}"
True
PS C:\> # 8文字
PS C:\> "test123" -match ".{8}"
False
PS C:\>
|
PowerShellでは、matchを使うことで、文字列が正規表現にマッチするか否か判定できます。
配列の場合は、一致する要素が取得されます。
1
2
3
4
5
|
PS C:\> # 数字を含む要素を取得する
PS C:\> "item1","itemb","item3","itemd" -match "[0-9]"
item1
item3
PS C:\>
|
文字列と配列で結果が異なることが分かります。
抽出
PowerShellでの正規表現にマッチした文字列の抽出方法を紹介します。
$Matchesを使用します。
実際のコマンドを見てみましょう。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
PS C:\> "test123" -match "[0-9]*$"
True
PS C:\> # 一致した文字列を表示
PS C:\> $Matches
Name Value
---- -----
0 123
PS C:\> "test123" -match "^test"
True
PS C:\> # 一致した文字列を表示
PS C:\> $Matches
Name Value
---- -----
0 test
PS C:\>
|
$Matchesを使うことで、正規表現にマッチした部分の文字列が抽出されることが分かります。
では、正規表現にマッチする文字列が複数存在する場合はどうなるでしょうか。
1
2
3
4
5
6
7
8
9
10
11
|
PS C:\> "123test456" -match "[0-9]+"
True
PS C:\> # 一致した文字列を表示
PS C:\> $Matches
Name Value
---- -----
0 123
PS C:\>
|
“456”も正規表現にマッチしていますが抽出されていません。$Matchesは最初にマッチした文字列を抽出します。
[RegEx]::Matchesを使用することで、正規表現にマッチする文字列が複数存在する場合もすべて抽出できます。
1
2
3
4
5
|
PS C:\> # 数字が1個以上連続する部分をすべて抽出
PS C:\> [RegEx]::Matches("123test456", "[0-9]+") | % {$_.Value}
123
456
PS C:\>
|
このように、PowerShellでは正規表現にマッチした文字列を抽出できます。
複数条件
PowerShellで複数の正規表現を指定する方法を紹介します。
|で正規表現を連結して記載します。
実際のコマンドを見てみましょう。
1
2
3
4
5
6
|
PS C:\> # 数字が1個以上連続する部分、または、小文字アルファベットが1文字以上連続する部分をすべて抽出
PS C:\> [RegEx]::Matches("123test456", "[0-9]+|[a-z]+") | % {$_.Value}
123
test
456
PS C:\>
|
このようにPowerShellでは、複数の正規表現を指定することもできます。
置換
PowerShellにて、正規表現にマッチした文字列を置換する方法を紹介します。
replaceに正規表現を使用します。
実際のコマンドを見てみましょう。
1
2
3
4
|
PS C:\> # 半角スペースをハイフンに置換
PS C:\> "Hello World!" -replace " ","-"
Hello-World!
PS C:\>
|
半角スペースがハイフンに置換されていることが分かります。
半角スペースが複数存在する場合も置換できます。
1
2
3
4
|
PS C:\> # 半角スペースをハイフンに置換
PS C:\> "Hello New World!" -replace " ","-"
Hello-New-World!
PS C:\>
|
最初にマッチした部分のみ置換したい場合は以下のように記述します。
1
2
3
4
5
|
PS C:\> # 半角スペースの1つ目をハイフンに置換
PS C:\> $r=[regex]'\s'
PS C:\> $r.Replace("Hello New World!",'-',1)
Hello-New World!
PS C:\>
|
このようにPowerShellでは、正規表現にマッチした文字列を置換できます。
正規表現の使用例
PowerShellでの正規表現の使用例を紹介します
まずは、正規表現にマッチするファイルを削除するコマンドです。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
|
PS C:\> # testフォルダの中身を表示
PS C:\> Get-ChildItem .\test\
ディレクトリ: C:\test
Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 2020/11/07 19:15 0 test.txt
-a---- 2020/11/07 19:15 0 test1.txt
-a---- 2020/11/07 19:15 0 test2.txt
-a---- 2020/11/07 19:15 0 test3.txt
PS C:\> # ファイル名がアルファベットの1文字以上+数字の1文字以上+.txt を抽出
PS C:\> Get-ChildItem .\test\ | Where-Object {$_.Name -match '[a-z]+[0-9]+\.txt'}
ディレクトリ: C:\test
Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 2020/11/07 19:15 0 test1.txt
-a---- 2020/11/07 19:15 0 test2.txt
-a---- 2020/11/07 19:15 0 test3.txt
PS C:\> # 抽出したファイルを削除
PS C:\> Get-ChildItem .\test\ | Where-Object {$_.Name -match '[a-z]+[0-9]+\.txt'} | ForEach-Object {$_.Delete()}
PS C:\> # testフォルダの中身を表示
PS C:\> Get-ChildItem .\test\
ディレクトリ: C:\test
Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 2020/11/07 19:15 0 test.txt
PS C:\>
|
正規表現にマッチするファイルが削除されていることが分かります。
次に、ファイルの中からIPアドレスを抽出するコマンドです。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
PS C:\> # ファイル出力
PS C:\> Get-Content .\test\test.txt
ipaddr:192.168.1.1
192.168.1.10.1 test
192.168.254.254
test
test 192.168.2.1 test
192.168.2.1
test
PS C:\> # ファイルからIPアドレスだけを抽出する
PS C:\> Select-String -Path .\test\test.txt -Pattern "\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}" -AllMatches -Encoding default | ForEach-Object { $_.Matches } | ForEach-Object { $_.Value }
192.168.1.1
192.168.1.10
192.168.254.254
192.168.2.1
192.168.2.1
PS C:\>
|
ファイル内のIPアドレス部分が抽出されていることが分かります。
まとめ
いかがでしたでしょうか。PowerShellでの正規表現の使い方について説明しました。
正規表現を使用すれば、マッチするか否かの判定・マッチした部分の抽出/置換などができます。
ぜひご自身でコマンドを書いて、理解を深めてください。
インフラエンジニア専門の転職サイト「FEnetインフラ」
FEnetインフラはサービス開始から10年以上『エンジニアの生涯価値の向上』をミッションに掲げ、多くのエンジニアの就業を支援してきました。
転職をお考えの方は気軽にご登録・ご相談ください。