サービスの検索システムの変更

前から悩んでいる検索時にJapaneseAnalyzerを使うと処理が遅いということ
検索で結果が帰ってくるのに5秒かかったら誰でも嫌気がさす

ということで検索はCJKもしくはNgramの拡張ですることに決定

けどこれだけじゃ、固有名詞だけではなく形容詞や助詞にすら引っかかってしまう。
カブトボーグがおもしろい」
の場合は、「カブトボーグ」と発言したユーザーを捜したいのに、「が」や「おもしろい」と発言したユーザーもヒット。
これを解決するために、そもそもクロールするときにJapaneseAnalyzerで固有名詞を拾い上げ、それでインデックスを作成するという方式にします。
こうすればsolrを使わずとも高速な検索が可能!

ということでいいかげんDBの設計して、DBからどうやってインデックスを直接作成するのか調べないと