【RAG ベストプラクティス探索】Reranker用のモデル比較とコスト削減実験
はじめに: Reranker何使う?問題
ELYZAで機械学習エンジニアのインターンをしている見目です。
本記事では、RAG システムにおける Reranker のモデル選定の考え方と、LLM を用いた Reranker のコスト削減手法をご紹介します。
Rerankerとは、Embeddingやキーワード一致を用いた初期検索の結果を、より精密な方法で再評価するRAGの主要コンポーネントです。Rerankerには様々なモデル形式がありますが、現在一般的に利用されているのは「Cross Encoder型」と「汎用LLM型」の2種類だと考えています。
Cross Encoder型
ク...