ノーマルビュー

一昨日以前

オープンアクセスリポジトリ連合(COAR)、学術文献におけるセマンティック多言語検索の概念モデル案開発プロジェクトに着手

2025年9月8日、オープンアクセスリポジトリ連合(COAR)が、学術文献におけるセマンティック多言語検索の可能性を調査し、その技術をリポジトリと全文データベースに適用できる概念モデル案の開発プロジェクトに着手したことを発表しました。

セマンティック多言語検索は、複数言語の文を共通する「意味空間」内のベクトルとして表す学習モデルである多言語埋め込み(multilingual embeddings)という技術により、様々な言語で書かれた学術文献を、言語や言葉遣いに関係なく発見可能とするものです。この記事では、開発プロジェクトの初期の調査結果、次の段階の作業概要が紹介されています。

初期の調査結果は次のとおり、有望なものであったとしています。

・言語間の検索は自然であった。
・取り上げられることの少ない言語の可視性が向上した。
・既存システムとの互換性が確認された。

同モデルを支える技術の詳細をまとめた完全な報告書を準備中で、コミュニティに公開する予定としています。

続きを読む

❌