再度大規模言語モデルについて
昨日から動かしている大規模言語モデルの追加学習。基本的な学習が済んだモデル(Pretrained Model)のファインチューニングと呼ばれる作業です。 たったの2000件のデータセット、サイズにして17.1MBのテキス … 続きを読む
昨日から動かしている大規模言語モデルの追加学習。基本的な学習が済んだモデル(Pretrained Model)のファインチューニングと呼ばれる作業です。 たったの2000件のデータセット、サイズにして17.1MBのテキス … 続きを読む
大規模言語モデル(LLM)の学習中。 VRAM12GBのGPUでやれる程度のそんなに大きくないやつ。 学習するデータはこんな格好をしたものがズラーと並んだテキストです。 { “output”: & … 続きを読む