類義語検索行うための辞書データの作り方

「適切な」類義語辞書は、人によって何を「適切」とするかによるので、登録するデータ、どのような検索を行い、どの単語とどの単語が類義語であるべきか?というところを定義していただく必要があります。

リンクは、Wikipediaのタイトルにある単語と、そのリダイレクトが類義語に相当するという考えのもとで行われている一例になるのかと思います。

辞書のフォーマットという意味では、https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-synonym-graph-tokenfilter.html こちらがそのフォーマットとなります。

類義語とは何か?どうしたいのか?をまずは考えていただくのが一番の近道になるかと思います。