サーバ運用管理の基本セットを作る

ZIKUUでは常時稼働しているサーバーが4台あり、サーバー自体の管理にWebminを、サーバー上で稼働しているアプリケーションの管理にはPortainerを使っています。Linux Server + Webmin + Portainerという構成のものと、Proxmox + Linux VM + Portainerという構成ものがあります。

今日はメインのサーバーに関して、監視を容易にするための仕掛け作りと、管理者用のマニュアルを書いて、塾の文書管理サーバーに置きました。

仕組み+マニュアルで「運用管理基本セット」とし、小規模事業者やコミュニティー運営に応用できるものにしています。

この基本セットの狙いは、

  • 気づく
  • 調べる
  • 対処する
  • 確認する

の各段階を容易にすることで、システム管理者の負担を減らしつつ、管理作業自体はしっかり行えるというものです。

「気づく」はDiscord通知なので、わざわざ管理画面を見に行かなくても良いし、「調べる」は文書化されたものを読むかChatGPTのようなAIに訊くで良い。「対処する」の部分は手順書を読んで実施するかカスタムコマンドを選ぶだけ、「確認する」は手順書に書かれています。

DXを推めたいと考えている企業経営者の方々、コミュニティー運営でデジタル技術を活用している・活用したいと考えている方々、ZIKUUのメンバーになって学んでみませんか?

以下、この「運用管理基本セット」の紹介です。

文書化

最低限やらなければならない管理項目に関する手順書

日常的に監視・対応しなければならない最低限の項目を抜き出して、その方法を書いた手順書です。

Webminの解説書

Webminの基本を理解するための解説文書。

WebminとDiscordの連携

WebとDiscordを連携させる仕組みの説明とその手順を示した文書。日常的な監視項目について、わざわざWebminの管理画面を開かなくても「気づく仕掛け」です。

仕掛け作り

Webminでの監視設定

Webminの監視機能を監視項目を追加する。

下の例では、CPUの負荷状況を監視する設定をしています。平均負荷を超えたらDiscordのWebhookを使って、Discordに通知を投げます。

監視の結果をDiscordに通知するシェルスクリプト。

テストで通知を投げたときのDiscordでの表示。

「サーバ運用管理の基本セットを作る」への1件のフィードバック

コメントする