機械学習の外れ値検知について

機械学習について質問させてください。

文字列データを機械学習にて学習させたいです。例えば、
過去データは"A","B","C"・・・・・"Y"のデータしか来ていないことを学習させ、"Z"という未知のデータが来た時に検知させるようにしたいです。

こういったことは機械学習の設定で実現可能でしょうか?

@t-nakata さん、

Elasticsearchの機械学習で利用できるデータはbooleanか数値型です。文字列を機械学習で利用するには何らかの方法でこれらの型に変換が必要です。
"A", "B", "C" などのデータは何種類程度あるのでしょうか?
また、機械学習に期待するところは何でしょうか?

単純に未知のデータか否かを判定させるだけであれば、機械学習を使うよりもElasticsearchに各データを_idで保存して、GETで存在チェックする方がシンプルで確実な様に思えました。
データの値自体をドキュメントのIDにして、Elasticsearchのindexを辞書の様に使う案です。

ご回答ありがとうございます。
未知のデータかどうかを判定するために使用することを考えていました。

各データをidで保存する形式で検討しようと思います

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.