言語モデルを作る続き
今日はあまり進みが良くありませんした。こういうのは辛抱強く淡々とやるしかありません。 ChatGPTのようなTransformerベースの言語モデルをスクラッチから作っているわけですが、知らないことに遭遇したときに、以前 … 続きを読む
今日はあまり進みが良くありませんした。こういうのは辛抱強く淡々とやるしかありません。 ChatGPTのようなTransformerベースの言語モデルをスクラッチから作っているわけですが、知らないことに遭遇したときに、以前 … 続きを読む
昨日の記事「GPUを使用するJupyter NotebookをDockerでデプロイする」でGPUを使うJupyter Notebookの準備ができたので、早速、久しぶりにプログラマーらしいことをやってみます。とりあえず … 続きを読む
画像生成AIのStable DiffusionのUIをシンプルにしたFooocusがなかなかお手軽で面白かったです。先日の非プログラマー向け自作PCワークショップでPinokioをインストールしてからStable Dif … 続きを読む
先日の自作PCワークショップでは非プログラマー向けに生成AI環境を構築して動かしました。その際に、GPUの稼働状況を監視するために以下のコマンドを使いました。 これは1秒おきにnvidia-simを実行する、というコマン … 続きを読む
今日はモノづくり塾で自作PCワークショップをやりました。 AMD Ryzen 5とGeForce RTX 4070の繰り合わせでPCを組み、Linuxをインストールしてから、オープンソースの生成AI実行環境をインストール … 続きを読む
モノづくり塾のAI学習環境は、Linux PCにNVIDIAのGPUを搭載し、NVIDAドライバーとCUDAツールキットをインストールし、DockerとNVIDIAコンテナツールキットをインストールし・・・・・とLinu … 続きを読む
だいぶ前にLLMアプリケーション開発環境のDifyでFireCrawlというクローリングサービスと連携したRAGアプリケーションが作れるようになり、実際にFireCrawlのクラウドサービスに接続してGemini Pro … 続きを読む
左はRTX A4000搭載のCore i5 13500でGemma 2 9Bモデルを使用、右はCore i5 13400でGemma2 9Bの4bit量子化モデルを使用。 GPU有りの場合が16秒、GPU無しの場合が1分 … 続きを読む
最近は文章を入力する手間を省く、アイデアをまとめる、調べものをするというときに生成AIを利用することがあります。ChatGPTに代表される商用生成AIの性能は素晴らしいのですが、仕組み的に完璧な文章が生成されるわけではな … 続きを読む
コードレビューはプログラムの添削を行う行為です。 先日書いたNodeJSを使ってDify APIをアクセスする簡単なプログラムを生成AIにコードレビューしてもらいました。使用したLLMはGemma2 9Bです。(2Bでも … 続きを読む