ノーマルビュー

LLMの文体について

2026年3月22日 01:39

Abstract LLMの出力にem dash（—）やコロン（:）が多い、という観察が広く共有されている。本実験では、これがベースモデルの時点で存在する傾向なのか、instruct tuning（SFT + RLHF）の段階で生じるのかを、Gemma 3 27B、Llama 3 8B、Qwen3 8Bの3モデルファミリーで比較した。加えて、安全性訓練を除去したabliteratedモデル（Qwen3.5 27B）も計測した。結果、instruct tuningが句読点・書式パターンに与える影響はモデルファミリーごとに大きく異なった。Gemma 3はダッシュ・コロン・マークダウン見出...

💾