ノーマルビュー

Received — 2026年3月7日 Zennのトレンド

ブラウザだけで完結する日本語OCR+透視変換(台形補正)を作ってみた

著者: tamoco
2026年3月5日 23:58
はじめに これまで日本語 OCR について、サーバーサイドで動かす yomitoku を使った Flask + TypeScript 構成や、ブラウザ上で動く Tesseract.js でカスタムモデルをトレーニングする方法を記事にしてきました。 今回は ブラウザ完結の日本語 OCR をさらに一歩進めて、斜めから撮影した文書画像を4点指定で台形補正してから OCR にかける仕組みを Pure TypeScript で実装しました。 本アプリケーションは国立国会図書館が公開している NDLOCR の軽量版をベースにしており、レイアウト認識(DEIMv2)と文字列認識(PARSeq)の ...

💾

Symphony - OpenAIが発表したチケット駆動AI開発ツールについて

2026年3月6日 16:48
こんにちは!ブロックチェーンエンジニアの山口夏生です。 ブロックチェーン×AI Agentで自律経済圏を創る開発組織Komlock labでCTOをしています。 コーディングエージェントを複数並列で自律的に回すマルチエージェント開発が、ここ数ヶ月でエンジニアの間に急速に広まっていますが、まだそれぞれ試行錯誤しているフェーズで、最適解はない認識です。 OpenAIが最近発表したSymphonyに注目しています。 https://github.com/openai/symphony 自分もClaudeCodeとOpenClawのオーケストレーションを日常的に考えていて、複数エージェントのタス...

💾

❌