ジョブキューを作って、文字起こしジョブを連投できるようになりました。
Whisperモデルも大中小を選べるようにしました。
中規模のモデルが一番使いやすそうです。
中規模モデルなら、RTX 3050やA2000などの6GB VRAM搭載GPUで動かせます。静かに知識や世相を取り込むサーバーを作れるでしょう。
今、ZIKUUの知のパイプラインというものを整理しつつある。
最終的にはAI塾長がすべての知を扱うことになるのだけれど、そこに通すパイプラインを設計するという話です。
外部の論文、YouTubeの動画などから、知識、世相を読み取るパイプ
内部で作られた論文、教科書、実用書、小説などを整理して中間フォーマットに整形するパイプ
場の雰囲気をデータに変換して、中間フォーマットに整形するパイプ
現場の知を分析、解析、利用法の検討を行って、中間フォーマットに整形するパイプ
今は、これらがバラバラで動いているけれど、これらがAI塾長に飲み込まれていく構造を設計しなければならないと思っている。
センサーネットワークの構築、新たなサーバーの用意、ワークフロー制御するアプリケーションと、これからやらないといけないことがてんこ盛りですが、全部揃えば、文明のバックアップ装置としてZIKUUというものが現れることになります。
とても面白い。
「Whisper Playgroud v0.1が完成する」への1件のフィードバック