Context Pipeline〜ZIKUU Research LibraryをPivotサービスに投入

ZIKUU Research Library (ZRL)は、Discordボット/Gitea/ローカルLLM/Nerve/Qdrantが連携するシステムで、DiscordarXivの論文検索リクエストを送信すると、ボットがarXivの論文を検索して、構造化してGiteaに保存し、Git ActionsNerveにイベントを送信、最終的にQdrantに論文を保存するというワークフローを実行するシステムです。

これが自動整形された論文エントリ。

これが自動要約された論文。

どちらも、タグの抽出、テーマの抽出、要旨の抽出などをローカルLLM(Ollama + gpt-oss:20b)がやっています。

この時点で構造化された論文情報になっていますが、これは飽くまでも人が見るもの。

今日はこのZRLの外側に、ZRLのリポジトリを読んで、PivotサービスFactを投入するパイプラインを作りました。ここでさらに意味を加えた構造化を行いAIが見る情報になります。

Pivotサービスに入ったFactPivot Workbenchで表示したのが冒頭のスクリーンショットです。

ここまでで、World Eye由来の国際ニュース、Earth Vision由来の地球観測データ、arXiv由来の論文、WordPress由来の活動記録とエッセイ、Discord由来の活動ログがPivotに入ったことになります。
残るは、ZIKUU基礎教科書由来の教養や論理とRadio Mind由来のラジオニュースのためのパイプラインの開発です。

要するに、

  • 国際ニュース
  • 国内ニュース
  • 地球観測データ
  • 活動記録
  • エッセイ(思想)
  • 教科書(教養と論理)

といった、コミュニティー内外の情報を多次元意味空間に蓄積されることになります。

ここまでZIKUU v1.0で想定している知識化対象ですが、活動記録・思想や哲学・教養や論理は、それぞれのコミュニティー独自のものに差し替えれば、コミュニティー特有の知識化ができます。これは飽くまでも知識化の枠組みです。

ZIKUUの発想は、いい加減なおしゃべり機械であるLLMに委ねずに、LLMが読む知識環境を整えます。結果的に、LLMの選択肢が増え、計算資源の節約を狙えます。

「Context Pipeline〜ZIKUU Research LibraryをPivotサービスに投入」への1件のフィードバック

コメントする