【PDF】日本語PDFの文字化けに怒ってRustでPDFパーサーを書いた Qiita - 人気の記事 著者:yfedoseev 2026年2月25日 09:06 自分のPythonプロジェクトでPDFのテキスト抽出が必要になった 仕事でPDFからテキストを抽出する処理を書いていて、英語のPDFはうまくいくのに日本語のPDFで文字化けが頻発しました。 # よくある光景 import pymupdf doc = pymupdf.ope...