Qwen3-Swallow & GPT-OSS-Swallow
2026年2月20日 18:15
はじめに
東京科学大学 修士2年の藤井です。
本日(2026/02/20)、Swallow LLM Projectから、Qwen3-Swallow-v0.2、GPT-OSS-Swallow-v0.1をリリースさせていただきました。これらのモデルは、それぞれAlibaba Qwen3とOpenAI GPT-OSSから日本語、英語、数学、コード、科学分野のデータセットを用いて、継続事前学習(Continual Pre-Training)、SFT(Supervised Fine-Tuning) を行い、その後、数学データセットを用いてRLVR(Reinforcement Learning ...