LLM
高文脈文化(ハイ・コンテクスト・カルチャー)
若い頃に出張で奈良に行った時に聞いた話ですが、「あそこにはつい最近○○があってね〜」というから、「いつ頃ですか?」と聞いたら400年前とのこと。400年前が「つい最近」なんだ?!と驚いたのを記憶しています。 日常会話をす … 続きを読む
Webサイトから気象画像を取得するだけなら簡単
雲の様子を取得するだけなら、SDRを購入しアンテナを作るといった手間は要りません。Webサイトから最新の衛星画像をダウンロードするだけです。 プログラムはこんな感じ。 cronで画像取得をスケジュール化する、取得した画像 … 続きを読む
Qwen3はこういうのが得意かも
そういえば、「もうプログラミングは誰かに教わる必要はないかも」といった書き込みをどこかで見ましたが、それが現実味を帯びてきたような気がします。 大きなモデルならChatGPT 4oやGemini Proよりも高性能だと謳 … 続きを読む
Qwen3を動かしたり天体望遠鏡を覗いたり
中国製の大規模言語モデルQwen3が公開されたのでローカルPCのOllamaで動かしてみました。 30BのMoE (Mixture of Expert)を4ビット量子化したもの、14Bの4ビット量子化したもの、4Bの3つ … 続きを読む
最小限のRAGアプリケーション
初学者向けの最小限のプログラムを作りました。 PDFを読み込み、Qdrantベクターデータベースに埋め込みデータを保存、OllamaのLLMを使って、埋め込みデータを元に文章を生成する例です。 最小限とは言っても、200 … 続きを読む
最小限のAIチャットプログラム
OpenAI APIを使ってOllamaで文章生成する小さなAIチャットプログラムです。 パラパラと生成された文章をストリーミング出力する例で47行のプログラムです。ストリーミング出力しなければ、41行、チャット履歴が不 … 続きを読む
LLMを扱うために必要なGPUのVRAM
このサイトを見ればLLMのパラメーターに対して必要なGPUのVRAMの容量がわかります。 いずれモノづくり塾でも70B (700億)パラメーター程度のオープンソース(またはオープンウェイト)のLLMを実用したいと思ってい … 続きを読む
MCP(Model Context Protocol)
これ、流行りそうですね。 あまり技術的な飛躍はない印象ですが、新しい言葉が使われるとなんとなく凄そうに見えます。 マイクロWebサービスが盛んに作られるようになり、多くのサービスにREST APIが実装され、Webサービ … 続きを読む