Execl文書をElasticsearchに取り込み、文書の検索が出来るようにしたいのですが、そのような事は可能かどうかご教示ただけないでしょうか
こんにちわ。
Excelなどのoffice文書に含まれるテキストを検索対象にしたい、ということでしょうか。
Elasticsearchの機能を使うのであれば・・・
こちらのプラグインを使うことで、ファイルからテキスト部分を抽出して、それを格納することができます。
使用イメージはこちらが参考になります。(古いのでそのままは参考にできませんが、イメージは伝わると思います)
事前に処理することができるのであれば・・・
Apache Tikaを使って自分でテキスト抽出プログラムを用意し、その結果をElasticsearchに投入することで検索が可能になるかと思います。
手軽に始めたいのであれば・・・
こんなプロダクトを試す、という手もありそうです。
ご参考になれば幸いです。
This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.