日本語版のWordNetを連携させる方法


(Tarou Tanaka) #1

私は今、elasticsearchとWebアプリケーションを使って、日本語の全文検索システムを作っています。
そこで入力された単語の類義語も文章から検索できるようにしたいと思いました。

そこでWordnetをElasticSearchと連携させて、類義語検索を実装するのが良い方法だと考えました。

しかしこの連携をさせる良い方法が思いつきません。

私が調べた限りだと
ElasticSearch with WordNet
このリンクのように、"wn_s.pl"ファイルを使えば出来るようです。
しかしこの方法は英語だけだと思います。

また、日本語wordnetはsqliteのデータしか無いように思えます
日本語 WordNet

このことから私が考える類義語検索システムの手順は以下のようになりました。

1.検索ワードでsqliteにselectをかける。単語が複数返ってくる。
2.その単語を一個ずつ、elasticsearchに検索をかける。

ただこの方法だとElasticSearchに対する検索回数が多く、負荷が気になります。

何が良い方法はないでしょうか?


(Jun Ohtani) #2

sqliteから返って来た単語のリストでOR検索をすれば良いのではないでしょうか?
これであれば、Elasticsearchに対しては1回のみの検索となります。
ただ、単語のリストの長さ次第では、Elasticsearch側の負荷もそこそこ上がる可能性はあるかもしれません。


(Tarou Tanaka) #3

確かにor検索を使えばよかったです。単語のリストはある程度厳選しようと思います。
ご回答ありがとうございました。


(system) #4

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.