ElasticsearchでExcelを取り込む方法

Execl文書をElasticsearchに取り込み、文書の検索が出来るようにしたいのですが、そのような事は可能かどうかご教示ただけないでしょうか

こんにちわ。

Excelなどのoffice文書に含まれるテキストを検索対象にしたい、ということでしょうか。

Elasticsearchの機能を使うのであれば・・・

こちらのプラグインを使うことで、ファイルからテキスト部分を抽出して、それを格納することができます。

使用イメージはこちらが参考になります。(古いのでそのままは参考にできませんが、イメージは伝わると思います)

事前に処理することができるのであれば・・・

Apache Tikaを使って自分でテキスト抽出プログラムを用意し、その結果をElasticsearchに投入することで検索が可能になるかと思います。

手軽に始めたいのであれば・・・

こんなプロダクトを試す、という手もありそうです。

ご参考になれば幸いです。

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.