snuffkin
(Satoyuki Tsukano)
October 10, 2018, 9:55pm
1
Elasticsearchのkuromoji analysis pluginでユーザ辞書を利用する際の質問です。
https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-kuromoji-tokenizer.html
このページで「カスタム名詞」とあるようにpart-of-speech tagに自分用の品詞を指定できますが、
kuromoji analysis pluginで用意されている品詞を指定したい場合にどのような品詞があるのか分かりません。
kuromoji analysis pluginで用意されている品詞の一覧が分かるサイト(もしくはコード?)は、あるでしょうか。
バージョンは6.4を使っています。
r4-keisuke
(Sunggyu Kei Rhie)
October 10, 2018, 11:08pm
2
おはようございますー
kuromojiは特別に何かやってない限りmecabを使うので、mecab-ipadicが使ってる品詞体系を参考にするといいと思います。
以下はmecabの品詞idの説明です。
https://taku910.github.io/mecab/posid.html
snuffkin
(Satoyuki Tsukano)
October 11, 2018, 1:43pm
3
ありがとうございます!
そこを見るんですね。助かりました^^
johtani
(Jun Ohtani)
October 12, 2018, 10:27am
4
サンプルがKuromojiに含まれてますね、確か。
#
# This file defines a Japanese stoptag set for JapanesePartOfSpeechStopFilter.
#
# Any token with a part-of-speech tag that exactly matches those defined in this
# file are removed from the token stream.
#
# Set your own stoptags by uncommenting the lines below. Note that comments are
# not allowed on the same line as a stoptag. See LUCENE-3745 for frequency lists,
# etc. that can be useful for building you own stoptag set.
#
# The entire possible tagset is provided below for convenience.
#
#####
# noun: unclassified nouns
#名詞
#
# noun-common: Common nouns or nouns where the sub-classification is undefined
#名詞-一般
#
# noun-proper: Proper nouns where the sub-classification is undefined
This file has been truncated. show original
snuffkin
(Satoyuki Tsukano)
October 12, 2018, 1:24pm
5
なるほど、ここにあるんですね。
ありがとうございます!
system
(system)
Closed
November 9, 2018, 1:39pm
6
This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.