論文検索後の処理を作り始める
先週は、論文検索ボットを開発しました。主要な論文サイトから、キーワード検索して、所定の形式に整えてくれるボットです。 今日は、その検索結果を、塾のサーバーで動くGitea(GitHubのローカル版)にプッシュすると、Gi … 続きを読む
先週は、論文検索ボットを開発しました。主要な論文サイトから、キーワード検索して、所定の形式に整えてくれるボットです。 今日は、その検索結果を、塾のサーバーで動くGitea(GitHubのローカル版)にプッシュすると、Gi … 続きを読む
先日やった改良で、文字起こし言語を指定(+自動判別)できるようにしましたが、日本語以外で文字起こしした場合には、ローカルLLMを使って翻訳できるようにしました。 さらに翻訳したデータをNerveに送信できるようにしました … 続きを読む
年末年始に気になっていた部分を修正しました。そういうものがたくさんあります。 文字起こしする言語のデフォルトを日本語にしていたのが原因で、外国語の文字起こしがひどいことになっていました。デフォルトを自動検出にした上で、日 … 続きを読む
先日、Discordから取り込んだデータをNerve(神経回路)に流すモジュールを開発しましたが、今日はWhisper PlaygroundからNerveにデータを流す機能の開発をしました。 仕組みは簡単で、Whispe … 続きを読む
コア機能がだいたい動くようになったので、実際にデータを外界から吸い込むIngesterの開発をしました。 上のスクリーンショットは、サンプル実装のDiscordボットです。 Nerveは、Ingesterとパイプラインの … 続きを読む
文字起こししたデータのファイル保存と日本語への自動翻訳機能を追加しました。上のスクリーンショットは英語の動画を文字起こししたときのもの。 翻訳は後からいくらでもやるので、自動翻訳はやらなくても良いような気がしています。 … 続きを読む
ジョブキューを作って、文字起こしジョブを連投できるようになりました。Whisperモデルも大中小を選べるようにしました。中規模のモデルが一番使いやすそうです。 中規模モデルなら、RTX 3050やA2000などの6GB … 続きを読む
Whisperという文字起こしAIを使って、YouTube動画の音声を文字起こしするオモチャを作りました。 18分(1,080秒)の日本語で喋りっぱなしの動画から文字起こしする時間は、CPUのみ(Core i5 1350 … 続きを読む