ルーブリックに基づく主観的な判定を取り入れたGRPO学習

2026年3月27日 09:07

こんにちは。ELYZA Labチームの佐々木です。以下の記事ではverlというフレームワークを用い、以下のようなカスタムした報酬関数を用いてGRPO学習を行うための手順を紹介しました。この報酬関数は簡単なルールベースとなっていましたが、これを用いることで確かに「指定した文字数に近い要約を出力する」といった目標に向かってGRPO学習が進むことが確認できました。 codeTARGET_LENGTH = 50 def compute_score(data_source, solution_str, ground_truth, extra_info): """ 生成された文...

💾

Zennのトレンド
毎回ルールは書かなくていい。GitHub Copilot Agent Skillsで統一感を持たせる 2026年3月25日 17:41

毎回ルールは書かなくていい。GitHub Copilot Agent Skillsで統一感を持たせる

Zennのトレンド

著者: KSAN

2026年3月25日 17:41

GitHub Copilot を使っている方は、ぜひAgent Skillsを使ってほしいです。 SKILL.md にルールを書いておけば、依頼のたびに説明し直す手間を減らせますよ！！こんにちは。システム開発の経験をもとに、現場で使える AI 活用を発信している KSAN です。 Copilot にコード生成や文書作成を頼んでいると、こんなことはありませんか。前回と似た依頼なのに、出力の雰囲気が変わる新規チャットを開くたびに、プロジェクトのルールを説明しているチーム内でアウトプットのばらつきが出るこれ、毎回やってないでしょうか。せっかく Copilot で効率化を図りたい...

💾

Zennのトレンド
[技術書典20]技術同人誌を書く技術 2026年3月25日 17:32

[技術書典20]技術同人誌を書く技術

Zennのトレンド

著者: tadaken3

2026年3月25日 17:32

こんにちは。ちゅらデータでデータエンジニアしているtadaken3です。 4月11日から開催される技術書典にむけて、dbtに関する本（以下dbt本）を執筆しています。 DATUM STUDIO、ちゅらデータのメンバーが日々のプロジェクトの中で培ってきたdbt、データモデリングの技術、知見を惜しみなく、書籍の中に落とし込んでおりますので、ぜひ、手に取っていただけると幸いです。 https://churadata.okinawa/blog/techbookfest2026/ 今回は、技術書典20に向けた原稿の執筆をする中で、「技術同人誌を書くための方法」を簡単にまとめていきます。ボク自身も...

💾

Zennのトレンド
100ms以内で動作するVLAモデルの実車適用 2026年3月26日 11:00

100ms以内で動作するVLAモデルの実車適用

Zennのトレンド

著者: anonamename

2026年3月26日 11:00

はじめにチューリングのVLAチームでエンジニアをしている横井です。経済産業省およびNEDOが推進するプロジェクト「GENIAC」第3期の支援のもと、自社で開発したVLM「Heron」を土台に将来の走行軌跡を出力する自動運転VLAモデル「DriveHeron」をチームで開発しました。本記事では、DriveHeronを自動運転システムに統合し、リアルタイムで車両を制御できるようにした取り組みを紹介します。 https://youtu.be/bv90MHM74IY E2EモデルからVLAモデルへ自動運転で難しいのはカメラに映る情報を解釈し、交通規範や状況に照らして次の行動へ落と...

💾

Zennのトレンド
Claude Code Agent Teamで実現するAIのためのデータ品質向上プロセス 2026年3月26日 10:25

Claude Code Agent Teamで実現するAIのためのデータ品質向上プロセス

Zennのトレンド

著者: harry

2026年3月26日 10:25

こんにちは、クラシルでデータエンジニアをしているharry(@gappy50)です。我々データチームでは、昨年Tier定義の記事で紹介した通り、データモデルにTier（用途と重要度に応じた品質格付け。Tier3以上をAI利用可能とする）を設定し、品質を段階的に上げていく仕組みを運用しています。 https://zenn.dev/dely_jp/articles/dely-ai-ready-dataops-tier Tierが上がるほどデータの信頼性が高まり、AIを含めた高度な活用が可能になる。この仕組み自体は順調に回り始めていますが、Tierを上げるプロセス自体がボトルネックになるとい...

💾

Zennのトレンド
GitHub PRをレビューするTUIをつくった 2026年3月25日 22:18

GitHub PRをレビューするTUIをつくった

Zennのトレンド

著者: kawarimidoll

2026年3月25日 22:18

日々の開発で、AIエージェントにコードを書かせる時間がかなり多くなり、自分は指示出しとレビューが主になってきました。ターミナルからPRレビューもサクッとやりたいなーと考え、TUIツールを作りました。 https://github.com/kawarimidoll/gh-prism 既存ツールの課題 GitHub PRのdiffをTUIで確認できるツールはすでにいくつか存在します。自作する前に、diffnavやdifitを触ってみました。 https://github.com/dlvhdr/diffnav https://zenn.dev/yoshiko/articles/difi...

💾

Zennのトレンド
GitHub Copilot CLI でプレゼンテーションをする技術 2026年3月25日 21:40

GitHub Copilot CLI でプレゼンテーションをする技術

Zennのトレンド

著者: Kazuki Ota

2026年3月25日 21:40

はじめに技術というかちょっとした変わった使い方の紹介です。先日開催された「GitHub Copilot Dev Days Tokyo 2026 〜 GitHub Vibe Riders〜」で 10 分のショートセッションに登壇してきました。セッションタイトルは「GitHub Copilot CLI の個人的な好きなところ」です。このセッションでは、ちょっと変わった試みとして「GitHub Copilot CLI 自体にプレゼンテーションをさせる」というデモをやりました。PowerPoint は使わず、ターミナル上でスライド風のアスキーアートを表示してプレゼンを進行するという形です...

💾

複数の AI コーディングツールで開発体験を揃える — メモリ・スキル・サブエージェントの共通化

Zennのトレンド

著者: Yuta Takahashi

2026年3月25日 15:02

はじめにこんにちは、医科診療所プロダクト開発室 AI推進グループ所属の髙橋(@Wakeupsloth)です。最近の業務では、AIコーディングツールの環境整備をリードしています。メドレーでは、2025 年 9 月 8 日に公開した記事「数字でみるメドレーのAI活用現在地点とこれから」で述べている通り、「AI for All」を合言葉に、全社的な AI 活用を推進しています[1]。その一環として、プロダクト開発ではツールに縛られない柔軟な選定を方針の 1 つとしています[1:1]。ツール選択の自由がある一方で、チーム運用で重要なのは、ツールが異なっていても開発体験に大きな差を生ま...

💾

Zennのトレンド
Webサービスを作る上でRustを採用する必要ってほぼないよね 2026年3月25日 13:48

Webサービスを作る上でRustを採用する必要ってほぼないよね

Zennのトレンド

著者: miyabitti@ニート

2026年3月25日 13:48

! 3/28追記：想定より多くの方にご覧いただき、貴重なフィードバックもいただきました。ありがとうございます。いただいた指摘を踏まえ、Rustの強みについての記述を加筆し、開発コストに関する記述のバランスを修正しました。この記事は「速いから」という理由だけでRustを選ぶのは違うかも、という初学者向けの言語選択の話です。対象読者を明記せず、多くの方の貴重な時間を奪ってしまったことをお詫びします。 ! この記事は、にわか素人の戯言です。あと辛口なRust批判ではなく、言語選択の話です。対象読者基本的なプログラミングの概念を理解して、他の言語に手を広げてみようと考えている初...

💾

Zennのトレンド
NLP2026の最優秀賞・優秀賞から見る言語処理最前線 2026年3月25日 11:50

NLP2026の最優秀賞・優秀賞から見る言語処理最前線

Zennのトレンド

著者: Taisei Ozaki

2026年3月25日 11:50

松尾研究所の尾崎です．25卒でデータサイエンティストをやっています． 2026年3月9日から13日にかけて，栃木県宇都宮市のライトキューブ宇都宮にて言語処理学会第32回年次大会（NLP2026）が開催されました．NLP2025（長崎）に引き続き過去最大規模の記録更新が続いており，LLMブーム以降の自然言語処理分野の勢いを肌で感じました． NLP2026の看板．会場はライトキューブ宇都宮．今年度から尾崎はYANS(言語処理若手シンポジウム（YANS）)の運営委員に就任しましたので，来年以降もNLPには継続で参加します．皆さんとお会いできるのを楽しみにしています．YANSへのご参加もぜひ...

💾

Zennのトレンド
Microsoft Learn参照させるAgent Skillsあるじゃん！ 2026年3月24日 19:32

Microsoft Learn参照させるAgent Skillsあるじゃん！

Zennのトレンド

著者: ai chinen

2026年3月24日 19:32

はじめに周りの方の業務におけるAI活用がすごい…！ヘッドウォータース初参画のプロジェクトで最初に感じた事です開発経験やAzureの知識が浅い事に不安を感じてましたが、そもそも業務、開発を進める上でのAI活用でも遅れてました😭 なので、今回はAgent Skillsについて調べてみたのでまとめようと思います！ Agent Skillsとは Agent Skillsとは、コーディングエージェントに特定の能力や知識、手順を持たせるための仕組みです。エージェントが実行できるタスクをモジュールとして定義し、必要なときに読み込んで利用できるようにすることで、より安定した動作と高い再利...

💾

Zennのトレンド
Webアプリケーションにおけるキャッシュ戦略 2026年3月24日 18:36

Webアプリケーションにおけるキャッシュ戦略

Zennのトレンド

著者: catatsuy

2026年3月24日 18:36

発表資料 https://offers-jp.connpass.com/event/385661/ 自己紹介本名：金子達哉株式会社PR TIMES PR TIMES事業ユニット第一開発部長CTO 達人が教えるWebパフォーマンスチューニング〜ISUCONから学ぶ高速化の実践（技術評論社）（通称：ISUCON本）の著者の1人 6章「リバースプロキシの利用」・7章「キャッシュの活用」・8章「押さえておきたい高速化手法」を担当 catatsuyのIDで各種SNSにいます ISUCON練習用のprivate-isuや、GoのCLIツールとしてsed/grep代替...

💾

Zennのトレンド
ハーネスエンジニアリングで人間のコードレビューをやめる 2026年3月24日 14:44

ハーネスエンジニアリングで人間のコードレビューをやめる

Zennのトレンド

著者: Akatsuki

2026年3月24日 14:44

人間のコードレビューをやめた正直に言うと、意思決定の要らないコード品質のチェックに関しては、もう人間のレビューは不要だと思っている。人間のレビュワーはコードベースの一部しか把握していないし、疲れるし、遠慮するし、見落とす。AIはコードベース全体を読んだ上で、一貫した基準で指摘を出してくれる。しかもAIが数分で書いたコードを、人間が数時間〜数日かけてレビューするのは、単純にボトルネックでしかない。 hentekoさんのコードレビューをなくすことを考えるという記事にもすごく共感した。僕は今、コードレビューを完全にAIに任せている。この記事ではそのやり方を書く。ハーネスエンジニ...

💾

Zennのトレンド
NVIDIA RTX PRO 6000 Blackwell Max-Q 上で尾崎スキーム I を動かしてみる 2026年3月24日 14:26

NVIDIA RTX PRO 6000 Blackwell Max-Q 上で尾崎スキーム I を動かしてみる

Zennのトレンド

著者: Haruki Horike

2026年3月24日 14:26

はじめにこんにちは、Fixstars でアルバイトをしている堀毛晴輝です。近年の生成 AI、大規模言語モデル需要の高さから、そのようなモデル学習・推論に特化したアクセラレータが多数、開発・販売されています。例えば、最近の NVIDIA GPU は、従来の科学技術計算向けの高精度演算器よりも、AI 向けの低精度演算器の搭載を重視するようになり、この流れは今後も加速すると考えられています。 Fixstars Techblog にて、これまでに検証を続けてきたワークステーション向け最新 Blackwell GPU: NVIDIA RTX PRO 6000 Blackwell Max-...

💾

Zennのトレンド
【RAG】1000万文字の会話を理解させる手法 2026年3月24日 10:14

【RAG】1000万文字の会話を理解させる手法

Zennのトレンド

著者: sasakuna

2026年3月24日 10:14

導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は超長文をLLMが理解できるようにするための手法、「SRLM」について紹介します。 https://arxiv.org/pdf/2603.15653 サマリー LLMの性能は日々向上していますが、超長文に対しては、そもそものモデルの入力限界の問題や、精度の問題で必要な情報を適切に取り出すことができなくなってしまいます。「SRLM」は長文に対しての検索手法を複数作成して、その結果の多数決、推論ステップでの確信度合い、そして、推論ステップの長さをもとに、最も確からしい情報を取り出す手法です。モデルが直接扱いきれない10...

💾

Zennのトレンド
仕事はすべてSkillに書け - それ、Skill にしない？ 2026年3月22日 12:21

仕事はすべてSkillに書け - それ、Skill にしない？

Zennのトレンド

著者: jackchuka

2026年3月22日 12:21

「それ、Skill にしない？」最近、自分の口癖がこれになった。誰かがSlackで手順を聞いてきたとき。自分が同じ作業を3回目にやったとき。同僚にレビューの観点を説明しているとき。タイトルは盛ってる自覚はある。でも実際に50個以上作ってみて、割と本気でそう思っている。仕事のやり方が驚くほど変わった。仕事を「やる」のではなく「書く」ようになった。「ドキュメント書きましょう、なんて話は100回聞いたよ」と思うかもしれない。ただ、Agent Skill をきっかけに「仕事をドキュメント化する」ことの重要性が爆発的に高まった。 ConfluenceやWikiに書いた手順書は、大抵は書かれ...

💾

Zennのトレンド
JavaScriptとTypeScriptのpolyglot 2026年3月23日 22:50

JavaScriptとTypeScriptのpolyglot

Zennのトレンド

著者: Masaki Hara

2026年3月23日 22:50

Polyglot とは、複数のプログラミング言語 (あるいはより一般に、何らかのファイルフォーマット) で解釈できるプログラムのことで、多言語話者にちなんでこの名前がつけられています。Polyglotはしばしば、プログラミングに関する非実用的な探求として遊ばれます。 TypeScriptはJavaScriptのスーパーセットであるため、JavaScriptコードは自然にJavaScriptとTypeScriptコードのpolyglotとみなせます。しかしこれでは面白くないので、本稿では以下の条件を満たすpolyglotを提示します。 JavaScriptとして実行したときと、TypeS...

💾

Zennのトレンド
究極のマルチパラダイム次世代プログラミング言語Flix 2026年3月23日 22:28

究極のマルチパラダイム次世代プログラミング言語Flix

Zennのトレンド

著者: ABAB↑↓BA

2026年3月23日 22:28

プログラミング言語Flixで実験的にWebフレームワークFlame_Flixを実装しましたという記事も書きましたので、よければ合わせてご覧ください。みなさんは、複雑な要件を前にして「自分の実力不足」を痛感したことはないでしょうか。「もっと効率的なデータ構造はないか」「このアルゴリズムをより簡潔に表現できないか」「並行処理のバグが取れない……」といった悩みは、エンジニアなら誰もが一度は通る道です。しかし、その悩みは本当にあなた自身の「実力不足」だけが原因でしょうか。もしかすると、今使っている言語のパラダイムが、その問題に対して「最適ではない」だけかもしれません。本記事で紹介する...

💾

Zennのトレンド
【Claude Code】Kaggle上位勢が設定するClaude Codeのskillsとagentsをチェックする 2026年3月23日 20:13

【Claude Code】Kaggle上位勢が設定するClaude Codeのskillsとagentsをチェックする

Zennのトレンド

著者: nakakiiro

2026年3月23日 20:13

はじめに Claude Codeを使い始めると、まずCLAUDE.mdにルールを書き込むことが習慣になってきます。ですが、.claude/ディレクトリ以下にスキル定義やカスタムエージェントを置けることはご存知でしょうか。スキルはClaude Codeに対して「この手順でやれ」という再利用可能な手順書を与えるもので、カスタムエージェントは役割に特化したモードを定義するものです。これをKaggleコンペに本格的に組み込んでいる方々がいて、しかもGitHubでボイラープレートとして公開してくれています。参考になったので備忘録的に紹介します。忙しい人はここだけでOK mstさん（...

💾

Zennのトレンド
Raspberry Piではじめる自宅サーバー入門（第2巻：運用編） 2026年3月23日 19:21

Raspberry Piではじめる自宅サーバー入門（第2巻：運用編）

Zennのトレンド

著者: Murasan Lab

2026年3月23日 19:21

Raspberry Piでサーバーを立ち上げた。SSHで接続できるようになった。サービスも自動起動するようにした—— でも、ふと不安がよぎります。「このサーバー、外から攻撃されたらどうしよう？」本書は、Raspberry Piサーバーを「動いている」状態から「安心して運用できる」状態へとステップアップさせるための1冊です。ファイアウォールで不要な通信を遮断し、不正アクセスを自動でブロックし、VPNで外出先から安全に接続する。さらにDockerを使って、サービスの構築・管理をモダンな手法で行えるようになります。コマンドを丸暗記するのではなく、「なぜその設定が必要なのか」「その仕組みはどうなっているのか」を一つずつ丁寧に解説しています。ufw、fail2ban、CrowdSec、Tailscale、WireGuard、Cloudflare Tunnel、Docker——これらの技術を、仕組みから理解して使いこなせる力を身につけます。本書は「Raspberry Piではじめる自宅サーバー入門」シリーズの第2巻（運用編）です。サーバーの「守り」と「つながり」を、ここから固めていきましょう。

💾

ノーマルビュー