CSI ネットワークマスター 虎の穴 第10回

テーマ

ネットワークトラブルシュートマスター編

演目

「トラブルシューティングと耐障害性の高いネットワーク作り」

講師

近藤 邦昭氏 (株式会社まほろば工房 代表取締役)

資料はこちらから

第10回 開催レポート 〜レポート&開催風景〜

9月11日(火)に、「CSI ネットワークマスター 虎の穴 第10回〜ネットワークトラブルシュートマスター編〜」を広島市まちづくり市民交流プラザにて開催いたしました。
昨年度は、ネットワークの基礎知識を学んでいただくためのセミナーを開催いたしました。このネットワーク構築の総論の続きとして第10回の開催は「ネットワークトラブルシューティングと耐障害性」を主題とし、障害の強いネットワーク構築を対象として講義を行い、約60名の皆様にご参加いただきました。

椿理事長

冒頭にCSI理事長の椿 泰和より挨拶いたしました。記念すべき第10回のセミナー開催を機会に、改めて地方で最新のネットワーク技術動向を確認できる機会を提供することにより、地方に貢献できればと開催目的について紹介されました。
その後、株式会社まほろば工房、近藤 邦昭様を講師にお迎えし、「トラブルシューティングと耐障害性の高いネットワーク作り」と題して、障害対応のプロセスモデルをご解説していただきました。

会場風景

今回のセミナーは近藤様より3部構成でお話いただきました。

【セミナー第1部】

・ネットワーク障害の分類と概要

・障害対応プロセスモデルによる障害対応の実際

はじめに、ネットワークレイヤーの縦構造をベースに障害の分類についてご紹介いただきました。ネットワークレイヤーごとにキッチリと障害の種類を分けることは難しいが、下から見ていくと上に行くほど問題が多いと言う解説とともに、以下のように代表的な障害概要について分類別に述べられました。

回線障害(L1):主に業者によるミスと見られる
スイッチ・ルータなどネットワーク機器障害(L2):最近減ってきていますが、一例として海外から導入された機器は日本の高湿度による故障
ルーティング障害(L3):主に人的設定ミス

こちらでネットワークから離れ障害対応の分業化、切り分ける手法の検討が必要ということです。

サーバ機器障害(L3/4/5):大変多く見られる問題点としてディスクとファンの故障。ディスクの対応は非常に重要と指摘。
アプリケーション障害(L5/6/7):オープンソースソフトウエアの試験を行わずサービス用に使用され問題を起こすパターンが目立つ。
(L8):情報伝達ミスによる障害

様々な種類また、障害によって様々な症状が現われる中、ネットワークレイヤーに依存することが多いので、症状とレイヤーをあわせて考えると障害ポイントを絞りやすくなるとのことです。
障害のポイントをおさえておき、人的障害も含めて記録をつけておくと障害のタイプは見えてくるとご解説いただきました。重ねて記録することにより障害パターンが確認でき、それに対応することは可能とのことです。

続いて障害対応のプロセスモデルについてご解説いただきました。

プロセス概念

対応プロセスのカテゴリーは以下のようにあり、

発見と確認
ユーザーから、アプリケーションからの情報収集をもとに障害の再現性、障害の影響範囲を徹底的に検収するとのことです。
状態確認→レイヤー特定→ネットワークの中の箇所の特定、このプロセスの中作業と責任範囲を明確に切り分ける手順が大変重要と述べられました。
対応と経過報告
障害連絡→障害対応→復旧確認→復旧報告
障害情報収集にも必要とされますが、障害連絡の際かならず地域の協力体制は必要となると述べられました。ネットワークの物理構造が変わったとき(回線の増加、機器追加など)障害が起きるケースが非常に多いとの解説いただきました。復旧確認後1時間程度のログ確認の必要性と復旧報告は認知時間から復旧までの報告であるべきことがポイントとしてあげられました。
再発防止策
具体性に欠ける!

【セミナー第2部】

・障害に強いネットワーク構築とそのポイント

第2部は、ネットワーク構築の際、電源、ケーブリング、熱対策、など、障害をどうしたら起こさないようにするかご解説いただきました。

電源の計算方法、取り方、アース、電源コントロラー、電力計の活用などについてご解説いただき、特に復旧時に電源が落ちることが多いというご指摘もいただきました。

ケーブリングについてはケーブルの種類をご紹介をいただき、ケーブルのID付けについての重要さが述べられました。

熱対策については実例のご紹介をベースに温度、湿度、エアフローの管理とデータセンターなどの設備性能に応じたサーバ使用をポイントにご解説いただきました。

【セミナー第3部】

・アドレッシング

・ルーティング(経路制御)と冗長化プロトコル

・ネットワーク障害監視

最後に第3部として、技術向きの立場から耐障害性の高いネットワーク作りのいくつかのヒントをいただきました。

アドレス採番

アドレシングについてはグローバルとプライベートアドレスの概要説明と共にアドレス交換の仕組みについてご解説いただきました。ネットワークトラブルが発見された際、DNSが引けないケースが多く、アドレス体系の構成がわからないと迅速にトラブルシューティングはできないとアドレス採番のメリットが述べられました。

ルーティングプロトコルについてはトラブルシューティングと耐障害性を念頭にBGP (Border Gateway Protocol)、RIP (Routing Information Protocol)、OSFP (Open Shortest Path First)、それぞれの設定の簡単度、ルーターリソースへの負担、運用の複雑さの比較をご解説いただきました。企業のネットワークとして、障害分析にローカルループアドレスをすすめました。また、HSRP (Hot Standby Routing Protocol)の活用によって障害復旧時にL2の冗長化は非常に簡単にできるとご解説いただきました。

トラブルの前兆幻想を知る必要性について経過→予測→事前に手を打つことができるようにオープンソースネットワーク監視ツールの有効活動の具体例をいくつかご紹介いただきました。MRTG、RRDToolなどの活用によってトラフィック計測、変動などのパターンを知ることによってネットワークの拡張傾向など、アプリケーション導入後のトラフィックパターン変動など問題を発生させないためのネットワーク監視についてご解説いただきました。

質疑応答

セミナー第3部の後、参加者より質問が寄せられ、熱対策、ネットワークの再構築の際の細かい注意点について近藤様より補足のご説明をいただきました。障害対応には技術はもちろん重要ですが、ネットワーク管理者に心構えを持って欲しいと最後にメッセージがありました。

今後も、「CSI ネットワークマスター 虎の穴」は、ネットワーク業界の一線でご活躍の先生方をお迎えし講義を開催してまいります。引き続きよろしくお願いいたします。

なお、次回のCSI ネットワークマスター 虎の穴 は「携帯とネットワークの美味しい関係」と題して12月15日(土)に市民公開講座(無料)を予定しております。ご参加を心よりお待ちしております。

お問い合わせ先

CSI事務局 セミナー担当:宮本

セミナー専用Tel:090-7772-5114 (受付時間 平日10:00-18:00)
e-mail:seminar-sec[at]csi.ad.jp

主催:特定非営利活動法人 中国・四国インターネット協議会(CSI)