HathiTrust、デジタル化資料のメタデータ等から成るデータセット“Extracted Features”のバージョン2.5を公開
2025年7月30日 17:54
2025年7月24日、米国の大学図書館等による共同リポジトリ事業であるHathiTrustが、デジタル化資料のメタデータ等から成るデータセット“Extracted Features”のバージョン2.5を公開しました。
同データセットは、HathiTrust Digital Library上のデジタル化資料約1,870万件分のメタデータや、資料の各ページに含まれる語数、行数、品詞等に関する定量的な情報を提供するものです。バージョン2.5では、2020年に公開されたバージョン2.0以来の大規模な更新が行われたとあります。