文字起こしデータのAI解析

すでにサーバーで本番運用しているRadio Mindですが、今は毎朝文化放送を30分録音して自動文字起こしを実行しています。 いずれ、この文字起こしデータを知識化するパイプラインを組み込む予定ですが、知識化方法の検討を先 … 続きを読む

ニュースの比較実験1

文字起こしアプリの運用を始めたので、YouTubeの報道動画から文字起こし、AI翻訳・分析というのを時々やってみようと思います。 プロンプトチューニングの練習と思考の材料になればと思っています。 今日はイランの状況につい … 続きを読む

ローカルLLMを使ってWebアプリケーションを開発する

すでにWhisper PlaygroundというYouTube動画から文字起こしするアプリケーションを開発していますが、その軽量版をローカルLLMを助手にして開発していました。 アプリケーション概要 yt-dlpでダウン … 続きを読む

週末科学者という日々

週末科学者のすすめ 学校を卒業すると勉強しなくなる人も多いと思いますが、身体知(繰り返して身体で獲得する)、暗黙知(間合いや気配などを理解する)、形式知(一般的な知識)が身につくような学び方が大事です。やらなくてもいいん … 続きを読む

AI塾長ダッシュボードにユーザ管理画面を追加

上の画面がユーザー管理画面を表示した様子です。 light-authサーバーという自家製認証サーバーに対して、ユーザーの追加/削除/変更を行います。 並行して、普通のAIチャット機能も追加しました。ChatGPTみなたい … 続きを読む

ZIKUU基礎教科書をQdrantに投入する

今日は、1組のIngesterとパイプラインを作って、ZIKUUの基礎教科書(全26巻)をベクターDBに入れました。 かなりのボリュームのある教科書なので、ベクターDBに投入するのに時間がかかると思っていましたが、そうで … 続きを読む