文字起こしデータのAI解析
すでにサーバーで本番運用しているRadio Mindですが、今は毎朝文化放送を30分録音して自動文字起こしを実行しています。 いずれ、この文字起こしデータを知識化するパイプラインを組み込む予定ですが、知識化方法の検討を先 … 続きを読む
すでにサーバーで本番運用しているRadio Mindですが、今は毎朝文化放送を30分録音して自動文字起こしを実行しています。 いずれ、この文字起こしデータを知識化するパイプラインを組み込む予定ですが、知識化方法の検討を先 … 続きを読む
すでに簡易版というか軽量版のWhisper Playgroundを本番環境で動かしていますが、しっかりした作りの版を本番環境に載せました。 そのためには、i18n対応後に認証機能を追加しなければなりません。 これがZIK … 続きを読む
文字起こしアプリの運用を始めたので、YouTubeの報道動画から文字起こし、AI翻訳・分析というのを時々やってみようと思います。 プロンプトチューニングの練習と思考の材料になればと思っています。 今日はイランの状況につい … 続きを読む
すでにWhisper PlaygroundというYouTube動画から文字起こしするアプリケーションを開発していますが、その軽量版をローカルLLMを助手にして開発していました。 アプリケーション概要 yt-dlpでダウン … 続きを読む
週末科学者のすすめ 学校を卒業すると勉強しなくなる人も多いと思いますが、身体知(繰り返して身体で獲得する)、暗黙知(間合いや気配などを理解する)、形式知(一般的な知識)が身につくような学び方が大事です。やらなくてもいいん … 続きを読む
IBMが開発したGraniteというLLM。パラメーター数350Mから数Bまでの小型のモデルがなかなか高性能です。 ZIKUUでは少し前のバージョンのgranite-visionをVision Playgroundで試し … 続きを読む
上の画面がユーザー管理画面を表示した様子です。 light-authサーバーという自家製認証サーバーに対して、ユーザーの追加/削除/変更を行います。 並行して、普通のAIチャット機能も追加しました。ChatGPTみなたい … 続きを読む
昨日までの作業で、ブログ投稿、ZIKUU基礎教科書、ZIKUU語彙(概念定義)、論文、エッセイがQdrantに入ったので、今日はQdrantのデータを有効活用できるように、AI塾長のRAGを調整する機能を追加しました。 … 続きを読む
今日は、1組のIngesterとパイプラインを作って、ZIKUUの基礎教科書(全26巻)をベクターDBに入れました。 かなりのボリュームのある教科書なので、ベクターDBに投入するのに時間がかかると思っていましたが、そうで … 続きを読む
今日はNerveのワーカー(Ingester)とパイプラインを追加し、ZIKUUのホームページとブログの記事をQdrantに保存できるようにしました。「 日々の活動記録エッセイホームページのお知らせZIKUU出版からのお … 続きを読む