データセットを作るコードの修正版
前回はこのブログの記事をすべて取得するプログラムと取得した記事からデータセットを作成するプログラムが別でしたが、それらを1つのプログラムにまとめたのが以下です。 近々、小さめのLLMでファインチューニングをしてみようと思 … 続きを読む
前回はこのブログの記事をすべて取得するプログラムと取得した記事からデータセットを作成するプログラムが別でしたが、それらを1つのプログラムにまとめたのが以下です。 近々、小さめのLLMでファインチューニングをしてみようと思 … 続きを読む
中国製の大規模言語モデルQwen3が公開されたのでローカルPCのOllamaで動かしてみました。 30BのMoE (Mixture of Expert)を4ビット量子化したもの、14Bの4ビット量子化したもの、4Bの3つ … 続きを読む
OpenAI APIを使ってOllamaで文章生成する小さなAIチャットプログラムです。 パラパラと生成された文章をストリーミング出力する例で47行のプログラムです。ストリーミング出力しなければ、41行、チャット履歴が不 … 続きを読む
このサイトを見ればLLMのパラメーターに対して必要なGPUのVRAMの容量がわかります。 いずれモノづくり塾でも70B (700億)パラメーター程度のオープンソース(またはオープンウェイト)のLLMを実用したいと思ってい … 続きを読む
早く目が醒めたので、YouTubeやらWebやらを調べて、Web検索する生成AIプログラムを書いてみました。 動画やWebページの解説を見てエージェントというのは「こうやればいいんだ」と少し理解を進められたように思います … 続きを読む
LLM(生成AIの大規模言語モデル)とRAG(Retrieval Augmented Generation)のStreamlit(Python用のWebアプリケーション開発フレームワーク)を使ったサンプルプログラムを見つ … 続きを読む
モノづくり塾では多様なモノづくりの経験ができるようにしていますが、ほぼ一人で切り盛りしようと思うと、私の能力を超えてしまいます。なので、効率化できる部分は効率化して、どうしても時間のかかる作業はじっくりやるようにしていま … 続きを読む
オープンソースが大好きなモノづくり塾には朗報です。 生成AI界隈で話題沸騰しているDeepseek R1。Deepseekは米国から高性能GPUの輸出を規制されたチャイナで開発されました。計算資源としてのGPUが少なくて … 続きを読む