リーディングビュー

【RAG ベストプラクティス探索】Reranker用のモデル比較とコスト削減実験

はじめに: Reranker何使う?問題 ELYZAで機械学習エンジニアのインターンをしている見目です。 本記事では、RAG システムにおける Reranker のモデル選定の考え方と、LLM を用いた Reranker のコスト削減手法をご紹介します。 Rerankerとは、Embeddingやキーワード一致を用いた初期検索の結果を、より精密な方法で再評価するRAGの主要コンポーネントです。Rerankerには様々なモデル形式がありますが、現在一般的に利用されているのは「Cross Encoder型」と「汎用LLM型」の2種類だと考えています。 Cross Encoder型 ク...

💾

  •  
❌