自分の工房のブログやこのブログも含めて、私のモノづくりの歴史はほぼ完全に記録されています。これらの記録には、私ならではの視点や思考も含まれています。いずれ、これらをAIに学習させ、私の代わりに文章を生成して会話ができるようなAIを、塾の中で稼働させたいと考えています。これは、私の語り口や考え方、そして実際に行ってきたことを継承する一つの手段であると同時に、AIの実践的な活用を試みる実験でもあります。
また、すぐに実現できるわけではありませんが、私にできる程度のことなら、AIやロボットに任せてしまうのも悪くないと思っています。かつて「自分の仕事を無くす」という思考実験的な記事を書いたこともありますが、自分の仕事に固執せず、他の手段で実現できるならそちらに任せ、自分は新たな挑戦へと進むのが良いと考えています。
そこで試しにブログ記事を一括ダウンロードするスクリプトを書いてみました。
このスクリプトでこのブログの全記事をダウンロードできます。最近は、こういうプログラムが書きやすくなって有り難いです。

ダウンロードした記事の一部。

これをQLoRAファインチューニング用のデータセット(インストラクション・データセット)に変換するスクリプトはこういう感じです。

データセットの一部です。

このデータセットを使ってLLama3やGemma3などのLLMをファインチューニングする学習コードもそう苦労せずに書けます。
問題はハードウェア。塾のPCで一番強いのはRTX A4000 (VRAM 16G)搭載のPCですが、これだとあまり大きなLLMに学習させられません。試しに小さなモデルでとは思っていますが、結果にがっかりしそうで気が進みません。まあ、そんなに遠くない将来、安価にもっと強いPCを入手できるようになるでしょうし、こういうことのやり方を知っているだけでも価値があります。
「塾長AI」への1件のフィードバック