【実現したいこと】
日本語テキストをKuromoji分析をかませて、Tag Cloudで可視化している。重荷可視化したいのは英語・カタカナかつ、名詞なので、漢字の単語や形容詞、副詞などは表示結果から除去したい。
【制約】
データはIndex上には残しておきたいので、取り込み時にLogstashで漢字を除去する、などはできない。
【環境等】
・Kibana、Elasticsearch、Logstashのバージョン:6.6.2
【実現したいこと】
日本語テキストをKuromoji分析をかませて、Tag Cloudで可視化している。重荷可視化したいのは英語・カタカナかつ、名詞なので、漢字の単語や形容詞、副詞などは表示結果から除去したい。
【制約】
データはIndex上には残しておきたいので、取り込み時にLogstashで漢字を除去する、などはできない。
【環境等】
・Kibana、Elasticsearch、Logstashのバージョン:6.6.2
品詞で除外するのは、kuromoji_part_of_speechでstoptagsを指定することにより実現ができそうです。
https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-kuromoji-speech.html
名詞だけでタグクラウドを作ろうとした人の例がこちら。
漢字の除外は、ぱっと思いつかないので他の方の助言を待ちます。
This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.
© 2020. All Rights Reserved - Elasticsearch
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant logo are trademarks of the Apache Software Foundation in the United States and/or other countries.