Tag Cloudの表示結果から漢字の単語と、形容詞を除去する方法

【実現したいこと】
日本語テキストをKuromoji分析をかませて、Tag Cloudで可視化している。重荷可視化したいのは英語・カタカナかつ、名詞なので、漢字の単語や形容詞、副詞などは表示結果から除去したい。

【制約】
データはIndex上には残しておきたいので、取り込み時にLogstashで漢字を除去する、などはできない。

【環境等】
・Kibana、Elasticsearch、Logstashのバージョン:6.6.2

品詞で除外するのは、kuromoji_part_of_speechでstoptagsを指定することにより実現ができそうです。

https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-kuromoji-speech.html

名詞だけでタグクラウドを作ろうとした人の例がこちら

漢字の除外は、ぱっと思いつかないので他の方の助言を待ちます。

1 Like

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.