リーディングビュー

Skillsで実現する軽量パーソナルRAG

以前、MCPサーバーとしてRAGを構築する記事を書きました。 https://zenn.dev/mkj/articles/30eeb69bf84b3f PostgreSQL + pgvector + multilingual-e5-large という構成で、MCP経由でベクトル検索できるRAGサーバーです。このMCP RAGサーバーは、気に入ってはいたのですが、PostgreSQL + Dockerが必要だったり、MCPサーバーとしての設定が必要だったりと、少し使い勝手の悪い部分がありました。 今回は、もっと手軽にRAGを実現したいなと思いSkillを活用してもっと軽量なRAGを実現しま...

💾

  •  

Qwen3-TTSで10秒の音声で自分の声をクローン

Qwen3-TTSという音声合成モデルを使って、自分の声をクローンしてみました。たった10秒程度の音声サンプルから、かなりそれっぽい声が生成できました。 試してみた様子です https://x.com/karaage0703/status/2027961203482628352 私の声を知らないと…ですが、音声配信とかと比較してもらえましたら。 https://karaage-empire-radio.pages.dev/ DGX Sparkで動かしたのですが、動かし方をメモしておきます。なお、以降の動かし方はAI作成の動作方法の記録をもとに作成しています。 Qwen3-TTSとは ...

💾

  •  
❌