ノーマルビュー

Received — 2026年3月27日 Zennのトレンド

ルーブリックに基づく主観的な判定を取り入れたGRPO学習

2026年3月27日 09:07
こんにちは。ELYZA Labチームの佐々木です。 以下の記事ではverlというフレームワークを用い、以下のようなカスタムした報酬関数を用いてGRPO学習を行うための手順を紹介しました。この報酬関数は簡単なルールベースとなっていましたが、これを用いることで確かに「指定した文字数に近い要約を出力する」といった目標に向かってGRPO学習が進むことが確認できました。 codeTARGET_LENGTH = 50 def compute_score(data_source, solution_str, ground_truth, extra_info): """ 生成された文...

💾

【VS Code】GitHub Copilotのサブエージェント(.agent.md)でモデル指定が無視される問題と最新動向

著者: 妹尾悠真
2026年3月26日 18:39
はじめに VS CodeのCopilot Chatで .agent.md を使ったカスタムエージェント、便利ですよね。 特に runSubagent を使い、複数の専門エージェントをオーケストレーションする構成は、 VS Code公式ドキュメントでも推奨ユースケースとして紹介されています。 Subagents公式ドキュメント https://code.visualstudio.com/docs/copilot/agents/subagents 一方で、実際に高度な構成を組んでみると、 「サブエージェント側(.agent.md)で指定したモデルが無視され、親エージェントのモデルが...

💾

社内データの民主化 - GraphRAGで全DBを自然言語で横断検索できるMCPサーバーを作った話

著者: 辻 亮佑
2026年3月26日 08:01
みなさまこんにちは!エアークローゼットでCTOをしている辻です。 今回は、自分でもかなりの自信作だと思っている DB Graph 及び DB Graph MCP について詳しくお話しします。 全社に散らばる 15スキーマ、991テーブル、11のSQL DB + 6つのMongoDB を、Claude CodeやClaude Cowork等のAIから自然言語で検索・クエリできるModel Context Protocol (MCP)サーバーです。テーブル名を知らなくても「返却に関するテーブルを教えて」と聞けば答えが返ってくる。しかも本番データも安全に扱える。 「そんなの本当にできるの?」 ...

💾

takt で Codex・Cursor・Claude Code を協調させてみた ― 5回 ABORT して気づいた設計の急所

2026年3月26日 22:05
これはなに? takt という AI エージェントオーケストレーションツールを使って、自作 OSS に新機能を追加してみた体験記です。Codex CLI で仕様レビュー、Cursor で実装、Claude Code で受け入れ検査という3つのエージェントを1つのワークフローで協調させました。 実際の PR はこちらです。 https://github.com/coji/durably/pull/151 takt とは takt は複数の AI コーディングエージェントを順番に動かすためのツールです。「仕様レビュー → 実装 → テスト確認」のような一連の流れを YAML で定義し...

💾

git worktree を Worktrunk で管理したら手放せなくなった

著者: toshiykst
2026年3月26日 10:30
はじめに git worktree は、1つのリポジトリから複数の作業ディレクトリを同時に展開できる機能です。特に最近は Claude Codeなどのコーディングエージェントを並列で走らせるワークフローが注目されており、活用シーンが増えています。 この git worktree を Worktrunk で管理するようにしたところ、使い勝手がよくworktreeの操作や管理が快適になったので紹介したいと思います。 Rust 製のツールで、執筆時点では GitHub では 3.6k以上のスターを獲得しています。 https://github.com/max-sixty/worktrunk...

💾

毎回ルールは書かなくていい。GitHub Copilot Agent Skillsで統一感を持たせる

著者: KSAN
2026年3月25日 17:41
GitHub Copilot を使っている方は、ぜひAgent Skillsを使ってほしいです。 SKILL.md にルールを書いておけば、依頼のたびに説明し直す手間を減らせますよ!! こんにちは。システム開発の経験をもとに、現場で使える AI 活用を発信している KSAN です。 Copilot にコード生成や文書作成を頼んでいると、こんなことはありませんか。 前回と似た依頼なのに、出力の雰囲気が変わる 新規チャットを開くたびに、プロジェクトのルールを説明している チーム内でアウトプットのばらつきが出る これ、毎回やってないでしょうか。 せっかく Copilot で効率化を図りたい...

💾

私のClaudeCodeによるアプリ実装方法の紹介

著者: trkbt10
2026年3月26日 19:43
ClaudeCodeが誕生してまだ一年と、少しであるが、コーディングを取り巻く環境は激変した とはいえ、激変したのはコーディングのみであり、どう作るのかという点についてはいまだに人間に委ねられている 現段階で、エージェントをハンドリングするというノウハウの共有は、決して無駄ではないはずだ というわけで、私がエージェントを利用してソフトウェアを構築する際の手順について紹介したい 当然、これは私の使い方であり、決して正解を意味しないことは注意されたい 私はこれで作った、あなたはどうか、以上の意味はない 作るものを考える まずはこれがないと始まらない とりあえず、MBTIをモチーフにしよう...

💾

なぜ、Excel管理表は崩壊するのか ー 記録する表と、見るための表を分けよ

2026年3月26日 09:30
! この記事は、こちらの記事のExcelバージョンです。 https://zenn.dev/tokium_dev/articles/5c9e322cdee796 列が横にどこまでも伸び、大半のセルが空白。 右端の方には「育休開始日・2回目」という列がひっそりと佇んでいる。現在の状況という列には、在籍中・入社前・育休中・退職済みが混在している。 誰かが更新したらしいが、誰がいつ何を変えたのかわからない。 引継ぎのたびに繰り返される会話がある。 ——前任者が作ったやつで、自分もよくわからなくて…… これは、あなたがズボラだからでも、前任者が悪かったからでもありません。 管理表のつくり方に、...

💾

[技術書典20]技術同人誌を書く技術

著者: tadaken3
2026年3月25日 17:32
こんにちは。 ちゅらデータでデータエンジニアしているtadaken3です。 4月11日から開催される技術書典にむけて、dbtに関する本(以下dbt本)を執筆しています。 DATUM STUDIO、ちゅらデータのメンバーが日々のプロジェクトの中で培ってきたdbt、データモデリングの技術、知見を惜しみなく、書籍の中に落とし込んでおりますので、ぜひ、手に取っていただけると幸いです。 https://churadata.okinawa/blog/techbookfest2026/ 今回は、技術書典20に向けた原稿の執筆をする中で、「技術同人誌を書くための方法」を簡単にまとめていきます。ボク自身も...

💾

ドメイン駆動設計を1から勉強してみた感想

著者: ふるた
2026年3月25日 14:38
🌱 はじめに 開発経験も4年ほど経過し、仕様書の要件を満たすコーディングを行えるようになりました。 しかし、運用フェーズに進むと当然、不具合改修や要望変更が発生します。 その時に、機能単位や役割単位にディレクトリ構成やファイル管理をしているのに 「機能が一か所にまとまっているけど、ファイル修正がしにくい」 「役割の範囲がどんどん肥大化する」 というトラブルに最近悩まされています。 その時に、ドメイン駆動設計(DDD)の書籍に出会い、 「これで解決するのでは?」と軽い気持ちで手に取りました。 これが個人的には大正解で、先ほどのトラブルが解決する兆しが見えたため、 1から勉強してみ...

💾

Received — 2026年3月26日 Zennのトレンド

100ms以内で動作するVLAモデルの実車適用

著者: anonamename
2026年3月26日 11:00
はじめに チューリングのVLAチームでエンジニアをしている横井です。経済産業省およびNEDOが推進するプロジェクト「GENIAC」第3期の支援のもと、自社で開発したVLM「Heron」を土台に将来の走行軌跡を出力する 自動運転VLAモデル「DriveHeron」 をチームで開発しました。本記事では、DriveHeronを自動運転システムに統合し、リアルタイムで車両を制御できるようにした取り組みを紹介します。 https://youtu.be/bv90MHM74IY E2EモデルからVLAモデルへ 自動運転で難しいのはカメラに映る情報を解釈し、交通規範や状況に照らして次の行動へ落と...

💾

Claude Code Agent Teamで実現するAIのためのデータ品質向上プロセス

著者: harry
2026年3月26日 10:25
こんにちは、クラシルでデータエンジニアをしているharry(@gappy50)です。 我々データチームでは、昨年Tier定義の記事で紹介した通り、データモデルにTier(用途と重要度に応じた品質格付け。Tier3以上をAI利用可能とする)を設定し、品質を段階的に上げていく仕組みを運用しています。 https://zenn.dev/dely_jp/articles/dely-ai-ready-dataops-tier Tierが上がるほどデータの信頼性が高まり、AIを含めた高度な活用が可能になる。この仕組み自体は順調に回り始めていますが、Tierを上げるプロセス自体がボトルネックになるとい...

💾

【消費トークン1/12】コーディングエージェントにRAGは罠だった。「検索」ではなく「コンパイル」するDAGツールを作った話

著者: ふわせぐ
2026年3月26日 08:20
はじめに Claude Code や Cursor といった,Coding Agent ツールに思った通りのコードを書かせるために,ドキュメントやルールをせっせと生産する時代になったわけですが,ドキュメントが増えれば増えるほど,AI は正しいドキュメントを探すためにたくさんの Token を消費したり,それでいて適切な情報にたどり着けなかったりします. AI 駆動開発の現場では 最初は, AGENTS.md に簡単なディレクトリ構成などを書きます. 少しずつ固有の設計や実装ルールが増えてくると,docs/architecture.md に移して,設計方針をまとめます. AGENT...

💾

GitHub PRをレビューするTUIをつくった

著者: kawarimidoll
2026年3月25日 22:18
日々の開発で、AIエージェントにコードを書かせる時間がかなり多くなり、自分は指示出しとレビューが主になってきました。 ターミナルからPRレビューもサクッとやりたいなーと考え、TUIツールを作りました。 https://github.com/kawarimidoll/gh-prism 既存ツールの課題 GitHub PRのdiffをTUIで確認できるツールはすでにいくつか存在します。 自作する前に、diffnavやdifitを触ってみました。 https://github.com/dlvhdr/diffnav https://zenn.dev/yoshiko/articles/difi...

💾

画面設計書を Markdown で書く文化を浸透させたい

著者: .nk
2026年3月25日 20:21
1. はじめに 実務では、画面設計書が Excel や PowerPoint、Word で管理されていることが多いです。 それ自体は珍しくありませんし、提出物としては都合が良い場面もあります。 ただ、開発の現場で実際に使う設計資料として見ると、つらいことが多いです。 どこが変わったのか差分が追いづらい レビューで変更点に集中しづらい 実装と設計書の同期が崩れやすい コピー運用で古い記述が残る 画面ごとに表現がばらつきやすい その結果、画面設計書が「あるけど信用されない文書」になってしまうことがあります。 自分は最近、画面設計書をもっとドキュメントベース、できれば Markdown...

💾

なぜ最近のWEB開発は毎回アプリケーション基盤を作り直してしまうのか

著者: Tech Nexus
2026年3月25日 20:03
30年近くWEB開発の現場にいます。 HTMLベースで、ページ単位の見積もりが行われる時代に、PHPを用いてヘッダやフッタ、メニューを強化しつつ、DBと連携して一気に開発スピードが上がり、保守工数が減りました。 30年ほど前、趣味でビリヤードの対戦記録を残すサイトを作った時に、同じような表を<TABLE><TR><TD>・・・と書くのが面倒でした。 なので、全てデータ化しました。 ユーザが増えたときはボタン1つで各自のページが作られるようにしました。 そういった経験から、如何に楽して手間のかからないWEBシステムを作るかを考えて来ました。 最近...

💾

GitHub Copilot CLI でプレゼンテーションをする技術

著者: Kazuki Ota
2026年3月25日 21:40
はじめに 技術というかちょっとした変わった使い方の紹介です。先日開催された「GitHub Copilot Dev Days Tokyo 2026 〜 GitHub Vibe Riders〜」で 10 分のショートセッションに登壇してきました。セッションタイトルは「GitHub Copilot CLI の個人的な好きなところ」です。 このセッションでは、ちょっと変わった試みとして「GitHub Copilot CLI 自体にプレゼンテーションをさせる」というデモをやりました。PowerPoint は使わず、ターミナル上でスライド風のアスキーアートを表示してプレゼンを進行するという形です...

💾

複数の AI コーディングツールで開発体験を揃える — メモリ・スキル・サブエージェントの共通化

2026年3月25日 15:02
はじめに こんにちは、医科診療所プロダクト開発室 AI推進グループ所属の髙橋(@Wakeupsloth)です。最近の業務では、AIコーディングツールの環境整備をリードしています。 メドレーでは、2025 年 9 月 8 日に公開した記事「数字でみるメドレーのAI活用 現在地点とこれから」で述べている通り、「AI for All」を合言葉に、全社的な AI 活用を推進しています[1]。その一環として、プロダクト開発ではツールに縛られない柔軟な選定を方針の 1 つとしています[1:1]。 ツール選択の自由がある一方で、チーム運用で重要なのは、ツールが異なっていても開発体験に大きな差を生ま...

💾

Webサービスを作る上でRustを採用する必要ってほぼないよね

2026年3月25日 13:48
! 3/28追記:想定より多くの方にご覧いただき、貴重なフィードバックもいただきました。ありがとうございます。 いただいた指摘を踏まえ、Rustの強みについての記述を加筆し、開発コストに関する記述のバランスを修正しました。 この記事は「速いから」という理由だけでRustを選ぶのは違うかも、という初学者向けの言語選択の話です。 対象読者を明記せず、多くの方の貴重な時間を奪ってしまったことをお詫びします。 ! この記事は、にわか素人の戯言です。あと辛口なRust批判ではなく、言語選択の話です。 対象読者 基本的なプログラミングの概念を理解して、他の言語に手を広げてみようと考えている初...

💾

外部サービスの利用ガイドラインを作ってわかった、エンジニアが見落としがちな法的観点

著者: moneymog
2026年3月25日 12:00
! この記事は、KNOWLEDGE WORK Blog Sprint 2026 Spring の 17 本目の記事です。 「このSaaS、業務で使っていいですか?」 チームメンバーからの質問に、即答できませんでした。ISMS?取ってる。SOC2?ある。セキュリティ的には問題なさそうだ。でも、それだけで「使っていい」と言い切れるのか──。 SaaSプロダクトを開発する会社で、ISMS運用やセキュリティ施策を担当しています。生成AIをはじめとする外部サービスの利用が加速する中、利用可否を判断するためのガイドラインを法務と協力して策定しました。 その過程で得た最大の学びは、 外部サービスの利...

💾

❌