Perl
Perlって
- [001]Perl
- [002]最初ののプログラム
- [003]DOSでの実行方法
- [004]文字の置換
- [005]正規表現
perl は、いろいろなテキス トファイルを加工することができる作業向けのインタプリタ型言語です。
文法は C の式の文法に非常に良く似ていますので、これらの言語に慣れ親しんでいる人はすぐに覚えられるでしょう。
AWKとSEDを触ったことのある方に説明するとAWKとSEDをたしたものです。
今回はDOS or WindowsのJperl.exeで説明します。
while(<>){
print;
}
これは単にファイルの内容をそのまま出力します。
これをstep01.plとして保存します。
jperl step01.pl [input]
これはファイルを加工して標準出力します。
ファイルに出力するには
jperl step01.pl [input] > [output]
文字の置換はSEDとおなじで
s/置換前/置換後/g;
オプションのgは全部ということです。
これをまとめると
while(<>){
s/置換前/置換後/g;
print;
}
文字の一対一の置換は
tr/置換前文字列/置換後文字列/;
(例)
tr/abcd/ABCD/;
SEDではyでしたが、これも使うことができます。
正規表現は任意の文字列を表現します.これを知っていると便利でしょう。
<文字> その文字自身
「.」 任意の1文字(全角,半角の区別なく)
「*」 直前の文字,キャラクタクラスまたは部分文字列を,0回以上の繰り返したもの
「^」 行頭(被検索文字列の先頭)
「$」 行末(被検索文字列の終わり)
20歳〜29歳は「2.歳」で表わすことができます。
行の最後の改行記号は「\n$」
行の先頭の空白は「^ 」
\nとは改行(\x0a \x0d)を表わしています。
他にも
\d 数字 ([0-9] と同じ)
\D \d 以外
\w 英数字 ([0-9a-z_A-Z]と同じ)
\W \w 以外
\s 空白文字 ([ \t\n\r\f]と同じ)
\S \s 以外
「[ ]」
[ ]は間に含まれる文字列中の1文字を表わします。
[ ]の中の説明
「-」 範囲
「^」 逆の意味
[aA] aまたはA
[^0-9] 数字を除く任意の1文字
[\x09] TAB文字
Continue....
[TOP]