Whisper Playground v0.2への拡張
文字起こししたデータのファイル保存と日本語への自動翻訳機能を追加しました。上のスクリーンショットは英語の動画を文字起こししたときのもの。 翻訳は後からいくらでもやるので、自動翻訳はやらなくても良いような気がしています。 … 続きを読む
文字起こししたデータのファイル保存と日本語への自動翻訳機能を追加しました。上のスクリーンショットは英語の動画を文字起こししたときのもの。 翻訳は後からいくらでもやるので、自動翻訳はやらなくても良いような気がしています。 … 続きを読む
スキマ時間に少しずつ書いている実用書。これもいずれはAI塾長の知として利用されることになります。 この本は、面白おかしく社会の問題点を描く「ずんだもん系YouTube動画」をAI文字起こしして、AI解析を加えた上で、丁寧 … 続きを読む
ジョブキューを作って、文字起こしジョブを連投できるようになりました。Whisperモデルも大中小を選べるようにしました。中規模のモデルが一番使いやすそうです。 中規模モデルなら、RTX 3050やA2000などの6GB … 続きを読む
Whisperという文字起こしAIを使って、YouTube動画の音声を文字起こしするオモチャを作りました。 18分(1,080秒)の日本語で喋りっぱなしの動画から文字起こしする時間は、CPUのみ(Core i5 1350 … 続きを読む
現代日本では戦争で死なない時代の中を男性は生きている。 家庭を持ち、子どもをもうけて、独り立ちできるまで養う。同時に子どもたち(自分の子どもだけに限らない)が独り立ちする頃に、社会が健全に機能し職がある状態になるように準 … 続きを読む
GoogleやAppleのクラウドからNextCloudやファイルサーバーへ、クラウドAIからローカルAIへ、塾内Wikiとアプリケーション群、欲しいアプリは自分で作る、論文を整理して内部知識に変換する、買うより作るとい … 続きを読む
AI塾長は、人格を持ったように見えるAIシステムなので、人間のプロファイルを反映させる研究をしなければなりません。特定の人の世界観、思考の流れ、思考の癖、みたいなものを再現できるようにしたいと思っています。 これを、大き … 続きを読む
先週開発を始め、技術白書をまとめたVibe Playground。 詳しくは開発を始めたときの投稿と、技術白書を読んでください。 前回までの状態だと、今ひとつVibe(場の雰囲気)が生成画像に反映されていなかったので、画 … 続きを読む
先月はうっかり飛ばしてしまったカレーの会。今月はしっかりやりました。 今回は塾生と塾スタッフを合わせて3名と、少人数での会でした。人数が少ないときは、話し込めるという良さがあります。 ZIKUUのDiscordには、毎日 … 続きを読む
AIの話題は性能に偏りがちだ。けれど、ZIKUUが見ているのは「人とAIの関係のつくり方」。便利さや効率だけでなく、文化や倫理のまなざしでAIを扱う。その実践と理由を、ここにまとめておく。 性能競争の先にある問い AIと … 続きを読む