睡人亭

秀丸エディタの正規表現

エスケープシーケンス

エスケープコード

半角の円記号¥は、秀丸ではエスケープコードと呼ばれ、通常の文字とは異なる働きをします。

フォントによっては\(バックスラッシュ)と表示される場合もあります。

エスケープコードとは、コンピュータに特殊な振る舞いをさせるための文字である制御文字を、通常の文字列と識別するために利用する仕組みです。

¥を利用する事で、正規表現中にメタ文字それ自体を文字として指定したり、制御文字や文字コードを指定したり出来るようになります。

制御文字については、こちらの説明を参照してください。

メタ文字を文字として指定

メタ文字それ自体をキーワードとして指定する場合は、各メタ文字の直前に¥を半角で入力します。

¥自体を指定する場合は、¥¥と入力します。

メタ文字を文字として指定する場合の表記
メタ文字 メタ文字を文字として指定
^ ¥^
$ ¥$
[ ] ¥[ ¥]
( ) ¥( ¥)
. ¥.
+ ¥+
* ¥*
? ¥?
- ¥-
| ¥|

文字コードを指定

文字コード番号(Shift-JISのコードポイント)を指定する正規表現です。

¥ooo

oに8進数で文字コードを指定します。oは1~3桁

あ→¥101¥240

¥xhh

hに16進数で文字コードを指定します。hは1~2桁

あ→¥x82¥xA0

英単語関連

ここでの英単語とは、半角英字と_(アンダースコア)のみで構成された文字列を指します。

¥<

英単語の始まりを表します。

¥<kkで始まる英単語

¥>

英単語の終わりを表します。

¥>ddで終わる英単語

¥w

英単語を表します。

タグ付き正規表現

分量が多いので、こちらに別途解説ページを作成しました

制御文字

制御文字とは、文字集合には割り当てられているものの、通常の文字としては扱われない文字です。

では制御文字は何をするかと言うと、制御文字の割り当てられているコードポイントをコンピュータに送ることによって、改行タブなどの通常の文字では不可能な特殊な振る舞いをさせるために存在します。

そのため制御文字文字というよりも、特殊なバイト(ビット)列の組み合わせと言った方が適切かもしれません。

秀丸の正規表現では、制御文字は上述のエスケープコードとペアで利用されます。

上にも書きましたが、エスケープコード制御文字の組み合わせは、エスケープシーケンスと呼ばれます。

制御文字は厳密に言うと文字ではないので、表記することは出来ません。

秀丸のウィンドウでは、文字ではない事を示すために、通常の文字列とは異なる色で表記されます。

改行と水平タブを表示
改行と水平タブを表示

もし、これらの表記が見えなければ、以下の手順を実行してください。

  1. 秀丸のメニューのその他ファイルタイプ別の設定を選択します。
  2. ファイルタイプ別の設定のダイアログボックスが開きます。
  3. デザイン表示の順にクリックしてください。
  4. 表示させたい制御文字にチェックを入れてからOKを左クリックしてください。
秀丸の制御記号表示の設定画面
秀丸の制御記号表示の設定画面

正規表現では、便宜的に幾つかの文字を組み合わせてエスケープシーケンスを表記します。

秀丸では、以下に挙げた通りになります。

メタ文字を文字として指定する場合の表記
エスケープシーケンス 意味
¥n 改行(ニューライン)
¥t 水平タブ
上の二つはよく利用されます。
¥a ベル
¥b バックスペース
¥r キャリッジリターン
¥v 垂直タブコード
¥e エスケープコード
¥z エンドオブファイル(EOF:)