睡人亭

中国史研究のためのデジタルリソース入門

CHISE IDS 漢字検索の使い方

CHISEとは何か

CHISE(CHaracter Information Service Environment)とは、京都大学の守岡知彦氏が提示する、「従来の文字コードによる文字処理システムの限界を乗り越えるべく開発された、コンピュータで文字を扱うための総合的環境」です。

CHISEでは、文字を文字が持つ様々な要素(字形・音・意味・従来の文字コードの情報)の集合体として捉える事に最大の特徴があります。その為、利用の形態に応じて柔軟な運用が可能であり、そこが従来の字形(グリフ)に重きを置かざるを得なかった文字コードに対する利点であると言えるでしょう。

詳しくは、CHISEプロジェクトのページを参照の事。

CHISE IDS漢字検索とは?

CHISE IDS漢字検索とはIDSで規格化された文字の「部品」を利用してCHISEプロジェクトの漢字情報データベースから漢字を検索する方法です(CHISE / 漢字構造情報データベースについて)。

IDSとは、「漢字構成記述文字列(Ideographic Description Sequence:漢字を複数の「部品」の集合体として捉え、これら「部品」の合成により1文字の漢字を表現しようとする)」方法の内、Unicodeで標準規格として定義されたものを指します。

Unicode番号 文字 内容
2FF0 左→右
2FF1 上→下
2FF2 左→中央→右
2FF3 上→中央→下
2FF4 四方→囲む
2FF5 上→囲む
2FF6 下→囲む
2FF7 左→囲む
2FF8 左上→囲む
2FF9 右上→囲む
2FFA 左下→囲む
2FFB 重ねる

従来、この方法による漢字の検索は、XEmacs-CHISEといったいささか特殊な方法でしか利用できなかったのですが、2005年5月より同システムを利用した漢字検索Webページを通じて利用可能となった次第です。

現在では、UnicodeのCJK統合漢字・拡張領域A,Bの約7万字が利用可能です。無料で拡張領域Bまで検索可能な文字検索システムは他に殆どありませんので、是非覚えておきましょう。但し、表示には当然対応する字形(グリフ)が実装されたフォントが必要です。

CHISE IDS漢字検索で漢字検索

まず始めに、CHISE IDS漢字検索のWebページに移動しましょう。以下の画面が表示されるはずです。

CHISE IDS漢字検索の画面

部品文字列のフォームボックスに、検索する漢字の部品を入力してください(IDSの記号は入れないでください)。

ここでは、「」の部品「亼叩」を入力しました。

部品の入力順は適当で構いません。思いついた部品を適当に入力しましょう。

入力したら、検索開始をクリックして下さい。

下の画面の検索開始をクリックすると、CHISE IDS漢字検索を実行します。

部品文字列

検索が終了すると、以下の画面に切り替わります。

検索結果を標示

一番左が、該当する文字です。リンクが貼られている場合、クリックするとそれぞれの情報が表示されます。

左(もしくは上):CHISEの漢字データベースの画面

右(もしくは下):Unicode.orgのUniha dataの画面

CHISE IDS データベースの画面 Unicode.orgのUnihan dataの画面

二番目は、Unicodeのコード番号です。

三番目がIDSの各部品です。

その他、CBETAや唐代拓本の画像へのリンクが表示される場合があります。

その他

画像で表示されていなければ、該当する文字を選択してコピー各アプリケーションに貼り付けることで、Unicodeの文字として利用可能です。

但し、貼り付けの際には、形式を選択して貼り付けUnicodeテキスト形式で貼り付けた方がよいでしょう。

また、UnicodeのShift-JIS領域以外の文字(BMP・ExtA,B)については、アプリケーションが対応していなければ利用できませんので注意して下さい。

IDSの部品は、文字を構成する要素全てを入力しなくても構いません。また、部品そのものの形ではなく、元の字形で入力しても構いません。(例:にんべん「亻」→人 その他、さんずいは「水」等)。

『大漢和辭典』の番号で検索する事も出来ます。番号は「&M-*****;」の形式(「*」は数値。上の「命」の場合は、&M-03473;になります)で入力し、検索開始を左クリックしてください。フォームボックスに漢字に直された状態で表示されるはずです(もちろん、『大漢和辞典』の収録文字の中には、Unicode未収録のものもあります)。

同様に、Unicode文字の実体参照形式(「&#*****;」の形式。*は数値。この事例では「佾」が相当)で入力して検索開始を左クリックすると、フォームボックス上で当該の漢字に変換されます。

目的の漢字を上手く探せない場合、検索したい漢字が持つ部品を共有する他の漢字で探してIDSの部品を確定し、それを利用して探してみましょう。

例:「䱷」を探したい。

この字は「虍(とらがしら)」「魚(さかな)」「攵(のぶん)」を部品として持っていると推定されます。

「魚」はすぐにIMEで出てきますが、「虍」「攵」は出てこないかもしれません。

その場合、この両字を含む漢字、例えば「虎」「教」等を一旦検索して、検索後に表示される部品「虍」「攵」を再利用して検索しましょう。

23:52 2013/04/23