MoriV を使う

English version

treetrans による木構造変換や lexextract による辞書抽出の詳細を グラフィカルにブラウズするために,MoriV を使うことができます. MoriV は,素性構造や木構造を表すタグで拡張された XHTML を 表示することができるウェブブラウザです. 普通のウェブブラウザでは素性構造や木構造を見ることはできませんが, FireFox など,XSLT とXHTML をサポートしているウェブブラウザを使えば, XSLT で変換された素性構造や木構造を見ることができます.

木構造変換,辞書抽出の過程をブラウズする

木構造変換や辞書抽出の過程をブラウズするためには "enju-devel/moriv.lil" を使います. このモジュールは,http サーバおよび cgi として動作します. まず,"enju-devel/moriv.lil" を読みこみます.
% lilfes -l enju-devel/moriv
次に,cgi コマンドを起動します.
> ?- cgi.
すると,http サーバが起動し,接続待ち状態になります. サーバを起動したホストの 27109 ポートの /cgi-lilfes/moriv? に, ブラウザでアクセスしてください.
http://サーバを起動したホスト:27109/cgi-lilfes/moriv?
次のようなページが表示されます.

文法獲得のための mayz GUI

上側のフレームで構文木を入力すると, 下側のフレームで文法抽出の各ステップでの処理結果を見ることができます. 入力する構文木の形式は treetrans の入力と同じです.

構文木は一番上の入力フォームに直接入力して Input ボタンを押すか, その下の入力フォームにファイル名と行番号を指定して Read ボタンを 押すことで入力できます.

左下のメニューを選ぶと右下に処理結果を表示します. Input tree のメニューでは treetrans に入力した構文木の形が見られます. 同様に Derivation メニューでは lexextract が (木構造変換後の)構文木からつくった derivation が, Lexical entries メニューでは derivation から得られる語彙項目が表示されます. その下のメニューでは,treetrans による木構造変換の過程が見られます. 木構造変換のルール名が適用する順番に表示されているので, ルール名を選ぶとそのルールを適用した直後の木を見ることができます.

構文木は treetrans 内では素性構造で表されますが, 表示されるのは各ノードが記号 (TREENODE\SYM素性) になっている木です. 加えて,各ノードとして素性構造の一部 (TREE_NODE 素性の値) を表示する形式も選べます. その場合は各メニューの fstree を選びます. 全体の素性構造を見たい場合には fs を選びます. Derivation では各ノードに DERIV_SIGN 素性の値が表示される形式と, 全体の素性構造を表示する形式 (fs) が選べます.

Lexical entries メニューでは, 入力された単語ごとに次のものを表示します.

  1. 単語から抽出した語彙項目の名前 ('lex_template' 型)
  2. 語彙項目の名前を辞書に登録するためのキー ('word' 型)
  3. 辞書のキーの元になった単語 ('word' 型)
  4. 語彙項目の素性構造 ('hpsg_word' 型)
  5. 語彙項目の元になった語彙素項目の素性構造 ('hpsg_lxm' 型)

Enju 開発者用マニュアル Enju ホームページ 辻井研究室
MIYAO Yusuke (yusuke@is.s.u-tokyo.ac.jp)