ノーマルビュー

Received — 2026年3月23日 Zennのトレンド

LLMの文体について

著者: jun.manabe
2026年3月22日 01:39
Abstract LLMの出力にem dash(—)やコロン(:)が多い、という観察が広く共有されている。本実験では、これがベースモデルの時点で存在する傾向なのか、instruct tuning(SFT + RLHF)の段階で生じるのかを、Gemma 3 27B、Llama 3 8B、Qwen3 8Bの3モデルファミリーで比較した。加えて、安全性訓練を除去したabliteratedモデル(Qwen3.5 27B)も計測した。 結果、instruct tuningが句読点・書式パターンに与える影響はモデルファミリーごとに大きく異なった。Gemma 3はダッシュ・コロン・マークダウン見出...

💾

❌