資料内文書検索リニューアル

トップ ›  話題

資料内文書検索リニューアル

2010年2月13日 

資料内文書検索のシステムに使われている検索エンジンが新しくなりました。

従来は,検索候補の単語が複数ある場合は,それぞれのテキストボックスに一語のみを入れて検索していくものでした。

この方法は,単語をスペースで区切って検索することが出来ず,一回一回をテキストボックスを移動しながら入力をするという大変,検索をする者にとっては不便でした。

また,旧検索エンジンにはもう一つ不便がありました。それは,例えば,条文番号などの719条のような数字を半角で入力しなければ検索をすることができませんでした。これを719条というように,全角で入力をしても同様に検索結果を得られるようになりました。

この数字の入力に関しては,検索エンジンが用いているSQLと呼ばれるデータベースソフトがあるのですが,そのソフトが全角である日本語に対応していないことにあります。これを解決するために,検索エンジン内で,全角入力された文字を全角で検索するのと平行して半角にする処理をして,一致する検索結果があるか否かを調べるようにプログラムを組みなおしました。

そして,スペースで区切った入力で検索が出来るようにしたのも,同様に検索エンジン内で分割する処理をしています。しかし,使っている皆さんには,これらの処理は見えませんし,気にも止まらないでしょう。それは,GoogleやYahooの検索が既にスペースで区切る検索で検索結果を得られるからでしょう。ですが,GoogleやYahooの検索エンジンも同様な処理を見えないところで行っていますし,更に高度な機能を備えています。

今後の課題は,GoogleやYahooのような高度な機能を付加していくとともに漢数字,例えば七百十九条のように入力しても719条が検索語として,結果を得られるようにしたいと考えていますが,漢数字の場合,七一九条という表記でも同じ意味なので,大変に困難に感じます。

なにより,現在,データベース化されている資料が少ないことが問題です。これも時間と労力の問題に阻まれて困難がありますが,クリアしていくよう,日々,努力をしております。