ノーマルビュー

Received — 2026年3月27日 Zennのトレンド

ルーブリックに基づく主観的な判定を取り入れたGRPO学習

2026年3月27日 09:07
こんにちは。ELYZA Labチームの佐々木です。 以下の記事ではverlというフレームワークを用い、以下のようなカスタムした報酬関数を用いてGRPO学習を行うための手順を紹介しました。この報酬関数は簡単なルールベースとなっていましたが、これを用いることで確かに「指定した文字数に近い要約を出力する」といった目標に向かってGRPO学習が進むことが確認できました。 codeTARGET_LENGTH = 50 def compute_score(data_source, solution_str, ground_truth, extra_info): """ 生成された文...

💾

毎回ルールは書かなくていい。GitHub Copilot Agent Skillsで統一感を持たせる

著者: KSAN
2026年3月25日 17:41
GitHub Copilot を使っている方は、ぜひAgent Skillsを使ってほしいです。 SKILL.md にルールを書いておけば、依頼のたびに説明し直す手間を減らせますよ!! こんにちは。システム開発の経験をもとに、現場で使える AI 活用を発信している KSAN です。 Copilot にコード生成や文書作成を頼んでいると、こんなことはありませんか。 前回と似た依頼なのに、出力の雰囲気が変わる 新規チャットを開くたびに、プロジェクトのルールを説明している チーム内でアウトプットのばらつきが出る これ、毎回やってないでしょうか。 せっかく Copilot で効率化を図りたい...

💾

[技術書典20]技術同人誌を書く技術

著者: tadaken3
2026年3月25日 17:32
こんにちは。 ちゅらデータでデータエンジニアしているtadaken3です。 4月11日から開催される技術書典にむけて、dbtに関する本(以下dbt本)を執筆しています。 DATUM STUDIO、ちゅらデータのメンバーが日々のプロジェクトの中で培ってきたdbt、データモデリングの技術、知見を惜しみなく、書籍の中に落とし込んでおりますので、ぜひ、手に取っていただけると幸いです。 https://churadata.okinawa/blog/techbookfest2026/ 今回は、技術書典20に向けた原稿の執筆をする中で、「技術同人誌を書くための方法」を簡単にまとめていきます。ボク自身も...

💾

Received — 2026年3月26日 Zennのトレンド

100ms以内で動作するVLAモデルの実車適用

著者: anonamename
2026年3月26日 11:00
はじめに チューリングのVLAチームでエンジニアをしている横井です。経済産業省およびNEDOが推進するプロジェクト「GENIAC」第3期の支援のもと、自社で開発したVLM「Heron」を土台に将来の走行軌跡を出力する 自動運転VLAモデル「DriveHeron」 をチームで開発しました。本記事では、DriveHeronを自動運転システムに統合し、リアルタイムで車両を制御できるようにした取り組みを紹介します。 https://youtu.be/bv90MHM74IY E2EモデルからVLAモデルへ 自動運転で難しいのはカメラに映る情報を解釈し、交通規範や状況に照らして次の行動へ落と...

💾

Claude Code Agent Teamで実現するAIのためのデータ品質向上プロセス

著者: harry
2026年3月26日 10:25
こんにちは、クラシルでデータエンジニアをしているharry(@gappy50)です。 我々データチームでは、昨年Tier定義の記事で紹介した通り、データモデルにTier(用途と重要度に応じた品質格付け。Tier3以上をAI利用可能とする)を設定し、品質を段階的に上げていく仕組みを運用しています。 https://zenn.dev/dely_jp/articles/dely-ai-ready-dataops-tier Tierが上がるほどデータの信頼性が高まり、AIを含めた高度な活用が可能になる。この仕組み自体は順調に回り始めていますが、Tierを上げるプロセス自体がボトルネックになるとい...

💾

GitHub PRをレビューするTUIをつくった

著者: kawarimidoll
2026年3月25日 22:18
日々の開発で、AIエージェントにコードを書かせる時間がかなり多くなり、自分は指示出しとレビューが主になってきました。 ターミナルからPRレビューもサクッとやりたいなーと考え、TUIツールを作りました。 https://github.com/kawarimidoll/gh-prism 既存ツールの課題 GitHub PRのdiffをTUIで確認できるツールはすでにいくつか存在します。 自作する前に、diffnavやdifitを触ってみました。 https://github.com/dlvhdr/diffnav https://zenn.dev/yoshiko/articles/difi...

💾

GitHub Copilot CLI でプレゼンテーションをする技術

著者: Kazuki Ota
2026年3月25日 21:40
はじめに 技術というかちょっとした変わった使い方の紹介です。先日開催された「GitHub Copilot Dev Days Tokyo 2026 〜 GitHub Vibe Riders〜」で 10 分のショートセッションに登壇してきました。セッションタイトルは「GitHub Copilot CLI の個人的な好きなところ」です。 このセッションでは、ちょっと変わった試みとして「GitHub Copilot CLI 自体にプレゼンテーションをさせる」というデモをやりました。PowerPoint は使わず、ターミナル上でスライド風のアスキーアートを表示してプレゼンを進行するという形です...

💾

複数の AI コーディングツールで開発体験を揃える — メモリ・スキル・サブエージェントの共通化

2026年3月25日 15:02
はじめに こんにちは、医科診療所プロダクト開発室 AI推進グループ所属の髙橋(@Wakeupsloth)です。最近の業務では、AIコーディングツールの環境整備をリードしています。 メドレーでは、2025 年 9 月 8 日に公開した記事「数字でみるメドレーのAI活用 現在地点とこれから」で述べている通り、「AI for All」を合言葉に、全社的な AI 活用を推進しています[1]。その一環として、プロダクト開発ではツールに縛られない柔軟な選定を方針の 1 つとしています[1:1]。 ツール選択の自由がある一方で、チーム運用で重要なのは、ツールが異なっていても開発体験に大きな差を生ま...

💾

Webサービスを作る上でRustを採用する必要ってほぼないよね

2026年3月25日 13:48
! 3/28追記:想定より多くの方にご覧いただき、貴重なフィードバックもいただきました。ありがとうございます。 いただいた指摘を踏まえ、Rustの強みについての記述を加筆し、開発コストに関する記述のバランスを修正しました。 この記事は「速いから」という理由だけでRustを選ぶのは違うかも、という初学者向けの言語選択の話です。 対象読者を明記せず、多くの方の貴重な時間を奪ってしまったことをお詫びします。 ! この記事は、にわか素人の戯言です。あと辛口なRust批判ではなく、言語選択の話です。 対象読者 基本的なプログラミングの概念を理解して、他の言語に手を広げてみようと考えている初...

💾

NLP2026の最優秀賞・優秀賞から見る言語処理最前線

著者: Taisei Ozaki
2026年3月25日 11:50
松尾研究所の尾崎です.25卒でデータサイエンティストをやっています. 2026年3月9日から13日にかけて,栃木県宇都宮市のライトキューブ宇都宮にて言語処理学会第32回年次大会(NLP2026)が開催されました.NLP2025(長崎)に引き続き過去最大規模の記録更新が続いており,LLMブーム以降の自然言語処理分野の勢いを肌で感じました. NLP2026の看板.会場はライトキューブ宇都宮. 今年度から尾崎はYANS(言語処理若手シンポジウム(YANS))の運営委員に就任しましたので,来年以降もNLPには継続で参加します.皆さんとお会いできるのを楽しみにしています.YANSへのご参加もぜひ...

💾

Microsoft Learn参照させるAgent Skillsあるじゃん!

著者: ai chinen
2026年3月24日 19:32
はじめに 周りの方の業務におけるAI活用がすごい…! ヘッドウォータース初参画のプロジェクトで最初に感じた事です 開発経験やAzureの知識が浅い事に不安を感じてましたが、そもそも業務、開発を進める上でのAI活用でも遅れてました😭 なので、今回はAgent Skillsについて調べてみたのでまとめようと思います! Agent Skillsとは Agent Skillsとは、コーディングエージェントに特定の能力や知識、手順を持たせるための仕組みです。 エージェントが実行できるタスクをモジュールとして定義し、必要なときに読み込んで利用できるようにすることで、より安定した動作と高い再利...

💾

Webアプリケーションにおけるキャッシュ戦略

著者: catatsuy
2026年3月24日 18:36
発表資料 https://offers-jp.connpass.com/event/385661/ 自己紹介 本名:金子達哉 株式会社PR TIMES PR TIMES事業ユニット 第一開発部長CTO 達人が教えるWebパフォーマンスチューニング〜ISUCONから学ぶ高速化の実践(技術評論社)(通称:ISUCON本)の著者の1人 6章「リバースプロキシの利用」・7章「キャッシュの活用」・8章「押さえておきたい高速化手法」を担当 catatsuyのIDで各種SNSにいます ISUCON練習用のprivate-isuや、GoのCLIツールとしてsed/grep代替...

💾

Received — 2026年3月25日 Zennのトレンド

ハーネスエンジニアリングで人間のコードレビューをやめる

著者: Akatsuki
2026年3月24日 14:44
人間のコードレビューをやめた 正直に言うと、意思決定の要らないコード品質のチェックに関しては、もう人間のレビューは不要だと思っている。 人間のレビュワーはコードベースの一部しか把握していないし、疲れるし、遠慮するし、見落とす。AIはコードベース全体を読んだ上で、一貫した基準で指摘を出してくれる。しかもAIが数分で書いたコードを、人間が数時間〜数日かけてレビューするのは、単純にボトルネックでしかない。 hentekoさんのコードレビューをなくすことを考えるという記事にもすごく共感した。 僕は今、コードレビューを完全にAIに任せている。この記事ではそのやり方を書く。 ハーネスエンジニ...

💾

NVIDIA RTX PRO 6000 Blackwell Max-Q 上で尾崎スキーム I を動かしてみる

2026年3月24日 14:26
はじめに こんにちは、Fixstars でアルバイトをしている堀毛晴輝です。 近年の生成 AI、大規模言語モデル需要の高さから、そのようなモデル学習・推論に特化したアクセラレータが多数、開発・販売されています。 例えば、最近の NVIDIA GPU は、従来の科学技術計算向けの高精度演算器よりも、AI 向けの低精度演算器の搭載を重視するようになり、この流れは今後も加速すると考えられています。 Fixstars Techblog にて、これまでに検証を続けてきたワークステーション向け最新 Blackwell GPU: NVIDIA RTX PRO 6000 Blackwell Max-...

💾

【RAG】1000万文字の会話を理解させる手法

著者: sasakuna
2026年3月24日 10:14
導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は超長文をLLMが理解できるようにするための手法、「SRLM」について紹介します。 https://arxiv.org/pdf/2603.15653 サマリー LLMの性能は日々向上していますが、超長文に対しては、そもそものモデルの入力限界の問題や、精度の問題で必要な情報を適切に取り出すことができなくなってしまいます。 「SRLM」は長文に対しての検索手法を複数作成して、その結果の多数決、推論ステップでの確信度合い、そして、推論ステップの長さをもとに、最も確からしい情報を取り出す手法です。モデルが直接扱いきれない10...

💾

仕事はすべてSkillに書け - それ、Skill にしない?

著者: jackchuka
2026年3月22日 12:21
「それ、Skill にしない?」 最近、自分の口癖がこれになった。誰かがSlackで手順を聞いてきたとき。自分が同じ作業を3回目にやったとき。同僚にレビューの観点を説明しているとき。 タイトルは盛ってる自覚はある。でも実際に50個以上作ってみて、割と本気でそう思っている。 仕事のやり方が驚くほど変わった。仕事を「やる」のではなく「書く」ようになった。 「ドキュメント書きましょう、なんて話は100回聞いたよ」と思うかもしれない。ただ、Agent Skill をきっかけに「仕事をドキュメント化する」ことの重要性が爆発的に高まった。 ConfluenceやWikiに書いた手順書は、大抵は書かれ...

💾

JavaScriptとTypeScriptのpolyglot

著者: Masaki Hara
2026年3月23日 22:50
Polyglot とは、複数のプログラミング言語 (あるいはより一般に、何らかのファイルフォーマット) で解釈できるプログラムのことで、多言語話者にちなんでこの名前がつけられています。Polyglotはしばしば、プログラミングに関する非実用的な探求として遊ばれます。 TypeScriptはJavaScriptのスーパーセットであるため、JavaScriptコードは自然にJavaScriptとTypeScriptコードのpolyglotとみなせます。しかしこれでは面白くないので、本稿では以下の条件を満たすpolyglotを提示します。 JavaScriptとして実行したときと、TypeS...

💾

究極のマルチパラダイム次世代プログラミング言語Flix

著者: ABAB↑↓BA
2026年3月23日 22:28
プログラミング言語Flixで実験的にWebフレームワークFlame_Flixを実装しましたという記事も書きましたので、よければ合わせてご覧ください。 みなさんは、複雑な要件を前にして「自分の実力不足」を痛感したことはないでしょうか。 「もっと効率的なデータ構造はないか」「このアルゴリズムをより簡潔に表現できないか」「並行処理のバグが取れない……」といった悩みは、エンジニアなら誰もが一度は通る道です。 しかし、その悩みは本当にあなた自身の「実力不足」だけが原因でしょうか。もしかすると、今使っている言語のパラダイムが、その問題に対して「最適ではない」だけかもしれません。 本記事で紹介する...

💾

Received — 2026年3月24日 Zennのトレンド

【Claude Code】Kaggle上位勢が設定するClaude Codeのskillsとagentsをチェックする

著者: nakakiiro
2026年3月23日 20:13
はじめに Claude Codeを使い始めると、まずCLAUDE.mdにルールを書き込むことが習慣になってきます。ですが、.claude/ディレクトリ以下にスキル定義やカスタムエージェントを置けることはご存知でしょうか。 スキルはClaude Codeに対して「この手順でやれ」という再利用可能な手順書を与えるもので、カスタムエージェントは役割に特化したモードを定義するものです。これをKaggleコンペに本格的に組み込んでいる方々がいて、しかもGitHubでボイラープレートとして公開してくれています。参考になったので備忘録的に紹介します。 忙しい人はここだけでOK mstさん(...

💾

Raspberry Piではじめる自宅サーバー入門(第2巻:運用編)

著者: Murasan Lab
2026年3月23日 19:21
Raspberry Piでサーバーを立ち上げた。SSHで接続できるようになった。サービスも自動起動するようにした—— でも、ふと不安がよぎります。「このサーバー、外から攻撃されたらどうしよう?」 本書は、Raspberry Piサーバーを「動いている」状態から「安心して運用できる」状態へとステップアップさせるための1冊です。ファイアウォールで不要な通信を遮断し、不正アクセスを自動でブロックし、VPNで外出先から安全に接続する。さらにDockerを使って、サービスの構築・管理をモダンな手法で行えるようになります。 コマンドを丸暗記するのではなく、「なぜその設定が必要なのか」「その仕組みはどうなっているのか」を一つずつ丁寧に解説しています。ufw、fail2ban、CrowdSec、Tailscale、WireGuard、Cloudflare Tunnel、Docker——これらの技術を、仕組みから理解して使いこなせる力を身につけます。 本書は「Raspberry Piではじめる自宅サーバー入門」シリーズの第2巻(運用編)です。サーバーの「守り」と「つながり」を、ここから固めていきましょう。

💾

❌