大規模言語モデル
知識蓄積・共有の研究〜その1 LLMファインチューニングの試み
先日、このブログをクローリングして投稿を機械学習用のデータセットに変換するプログラムを書きました。今回はその続きで、そのデータセットを使った既存の学習済言語モデル(Pretreined Language Model)をL … 続きを読む
知識の蓄積と共有について研究する
モノづくり塾での活動から知識を蓄積して公開する方法を研究しています。例えば、 というようなことを漠然と考えています。 このブログのように日々の活動や思考を記録をしているのは、3の知識集積を意識していますが、塾生も含めた全 … 続きを読む
n8nで簡単なAIワークフローを作ってみる
Ollama、Qdrant、n8nの組み合わせで簡単なRAGアプリケーションを作ってみました。 初めての使用だったので調べながら作業して1時間くらいかかったと思います。ノーコードツールですので、非プログラマーの方でも十分 … 続きを読む
データセットを作るコードの修正版
前回はこのブログの記事をすべて取得するプログラムと取得した記事からデータセットを作成するプログラムが別でしたが、それらを1つのプログラムにまとめたのが以下です。 近々、小さめのLLMでファインチューニングをしてみようと思 … 続きを読む
Qwen3を動かしたり天体望遠鏡を覗いたり
中国製の大規模言語モデルQwen3が公開されたのでローカルPCのOllamaで動かしてみました。 30BのMoE (Mixture of Expert)を4ビット量子化したもの、14Bの4ビット量子化したもの、4Bの3つ … 続きを読む
最小限のAIチャットプログラム
OpenAI APIを使ってOllamaで文章生成する小さなAIチャットプログラムです。 パラパラと生成された文章をストリーミング出力する例で47行のプログラムです。ストリーミング出力しなければ、41行、チャット履歴が不 … 続きを読む
LLMを扱うために必要なGPUのVRAM
このサイトを見ればLLMのパラメーターに対して必要なGPUのVRAMの容量がわかります。 いずれモノづくり塾でも70B (700億)パラメーター程度のオープンソース(またはオープンウェイト)のLLMを実用したいと思ってい … 続きを読む
AI検索エージェントらしきもの
早く目が醒めたので、YouTubeやらWebやらを調べて、Web検索する生成AIプログラムを書いてみました。 動画やWebページの解説を見てエージェントというのは「こうやればいいんだ」と少し理解を進められたように思います … 続きを読む