はじめのProfessional Cloud Network Engineer認定取得講座⑤ネットワークオペレーションの管理、モニタリング、最適化を説明します！

今回のブログは、Professional Cloud Network Engineer認定取得講座５回目です！今回は、「セクション５：ネットワークオペレーションの管理、モニタリング、最適化」についての概要を説明します！

今回のブログで、ネットワークオペレーションの管理、モニタリング、最適化の全体像を説明します。

是非、最後までご覧いただけると嬉しいです。

Google Cloudのオペレーションスイートを使用してロギングとモニタリング
セキュリティを管理、維持
接続性の維持管理とトラブルシューティング
レイテンシとトラフィックフローのモニタリング、管理、トラブルシューティング
まとめ

Google Cloudのオペレーションスイートを使用してロギングとモニタリング

ネットワークコンポーネントのログの確認（例: VPN、Cloud Router、VPC Service Controls など）

Google Cloudのオペレーションスイート（旧称 Stackdriver）を使用すると、ネットワークコンポーネントのログを監視し、問題を特定してトラブルシューティングを行うことができます。オペレーションスイートには、次のコンポーネントが含まれます。

Cloud Logging：Cloud Loggingは、Cloud コンソールのログビューアーまたはAPIを使用して、Cloudサービスからログを収集、保存、分析できるサービスです。
Cloud Monitoring：Cloud Monitoringは、Cloud コンソールのダッシュボードまたはAPIを使用して、Cloudサービスからメトリック、ログ、アラームを収集、保存、分析できるサービスです。
Cloud Trace：Cloud Traceは、Cloud コンソールのダッシュボードまたはAPIを使用して、Cloudサービスからトレースを収集、保存、分析できるサービスです。

これらのコンポーネントを使用して、次のネットワークコンポーネントのログを監視できます。

VPN
VPNは、プライベートなネットワークとパブリックなネットワークの間に安全な接続を提供するサービスです。VPNのログを監視することで、不正アクセスやその他の問題を特定してトラブルシューティングを行うことができます。
Cloud Router
Cloud Routerは、複数のネットワーク間のルーティングを管理するサービスです。Cloud Routerのログを監視することで、ネットワークのパフォーマンスの問題を特定してトラブルシューティングを行うことができます。
VPC Service Controls
VPC Service Controlsは、VPC内のリソースへのアクセスを制御するサービスです。VPC Service Controlsのログを監視することで、不正なアクセスやその他の問題を特定してトラブルシューティングを行うことができます。

オペレーションスイートを使用してネットワークコンポーネントのログを監視することで、ネットワークのパフォーマンスとセキュリティを向上させることができます。

セキュリティを管理、維持

ファイアウォール（例: クラウドベース、プライベート）

Google Cloudでは、ファイアウォールを使用して、リソースへのアクセスを制御することができます。ファイアウォールは、IPアドレス、ポート、プロトコルに基づいてトラフィックを許可または拒否することができます。

Google Cloudには、2つのタイプのファイアウォールがあります。

クラウドベースファイアウォール：クラウドベースファイアウォールは、Google Cloudのすべてのリソースに適用されるファイアウォールです。
プライベートファイアウォール：プライベートファイアウォールは、特定のネットワークにのみ適用されるファイアウォールです。

ファイアウォールを使用して、Google Cloudのセキュリティを管理、維持することができます。たとえば、次のことができます。

不正なアクセスからリソースを保護する
リソースへのアクセスを許可するユーザーまたはグループを制限する
特定の種類のトラフィックを許可または拒否する

ファイアウォールは、Google Cloudのセキュリティを強化するための重要なツールです。ファイアウォールを使用して、Google Cloudのリソースを保護してください。

IAMの問題の診断と解決（例：共有 VPC、セキュリティ/ネットワーク管理者など）

IAMの問題の診断と解決（例：共有 VPC、セキュリティ/ネットワーク管理者など）について説明します。

共有VPC

共有VPCは、複数のプロジェクトが共通のネットワークリソースを共有できるようにする機能です。これは、コスト削減やリソースの効率化に役立ちますが、セキュリティ上のリスクも伴います。共有VPCを使用する際には、次の点に注意してください。

プロジェクト間でアクセス許可を正しく設定する
ネットワークトラフィックを監視し、異常を検出する
共有VPCの使用を承認するプロセスを定義する

セキュリティ/ネットワーク管理者

セキュリティ/ネットワーク管理者は、Google Cloudのセキュリティとネットワークを管理するユーザーです。セキュリティ/ネットワーク管理者は、次の権限を持ちます。

セキュリティ管理者

ファイアウォールの作成、削除、管理
SSL証明書の作成、削除、管理

ネットワーク管理者

ネットワークリソースの作成、変更、削除

セキュリティ/ネットワーク管理者は、Google Cloudのセキュリティとネットワークを保護する上で重要な役割を果たします。セキュリティ/ネットワーク管理者は、正しいトレーニングを受け、セキュリティポリシーを遵守することが重要です。

Google Cloudにおけるセキュリティを管理、維持することは、組織にとって重要なことです。共有VPCやセキュリティ/ネットワーク管理者などの機能を使用して、セキュリティを強化し、リスクを軽減することができます。

接続性の維持管理とトラブルシューティング

HTTP(S) ロードバランシングによるトラフィックフローのドレインとリダイレクト

HTTP(S) ロードバランシングによるトラフィックフローのドレインとリダイレクトについて説明します。

HTTP(S) ロードバランシングは、複数のバックエンドサーバーにトラフィックを分散することで、アプリケーションのパフォーマンスと信頼性を向上させるサービスです。ロードバランシングでは、各バックエンドサーバーの負荷を均等に分散し、障害が発生したサーバーを自動的に除外することで、アプリケーションの可用性を高めます。HTTP(S) ロードバランシングでは、トラフィックフローのドレインとリダイレクトを行うことができます。

トラフィックフローのドレインとは、特定のバックエンドサーバーに送信されるトラフィックを停止することです。

トラフィックフローのリダイレクトとは、特定のバックエンドサーバーに送信されるトラフィックを別のサーバーに転送することです。

トラフィックフローのドレインとリダイレクトは、アプリケーションのメンテナンスや障害発生時に使用されます。アプリケーションのメンテナンスを行っている場合は、メンテナンス中のバックエンドサーバーに送信されるトラフィックを停止することで、メンテナンス中のサーバーに負荷がかかるのを防ぐことができます。アプリケーションに障害が発生した場合は、障害が発生したサーバーに送信されるトラフィックを別のサーバーに転送することで、アプリケーションの可用性を高めることができます。

トラフィックフローのドレインとリダイレクトは、アプリケーションのパフォーマンスと信頼性を向上させるために重要な機能です。アプリケーションのメンテナンスや障害発生時には、トラフィックフローのドレインとリダイレクトを使用して、アプリケーションのパフォーマンスと信頼性を維持してください。

フローログを使用した、上りトラフィックと下りトラフィックのモニタリング

Google Cloudの接続性を維持管理し、トラブルシューティングを行うには、フローログを使用した上りトラフィックと下りトラフィックのモニタリングが役立ちます。フローログは、ネットワークインターフェイスとの間で行き来するIPトラフィックに関する情報をキャプチャし、Google Cloudコンソールの[ログエクスプローラ]ページで確認できます。

フローログには、次の情報が含まれます。

送信元IPアドレス
送信先IPアドレス
ポート番号
プロトコル
バイト数
パケット数
開始時間
終了時間

フローログを使用して、次のことができます。

特定のIPアドレスやポート番号からのトラフィックを監視
特定のプロトコルを使用するトラフィックを監視
特定の期間に発生したトラフィックを監視
トラフィックの増加や減少を監視

フローログは、ネットワークのパフォーマンスを監視し、トラブルシューティングを行うのに役立ちます。たとえば、特定のIPアドレスやポート番号からのトラフィックが急増している場合、攻撃を受けている可能性があります。また、特定のプロトコルを使用するトラフィックが遅延している場合、ネットワークの設定に問題がある可能性があります。

フローログを使用して、ネットワークのパフォーマンスを監視し、トラブルシューティングを行うことで、Google Cloudの接続性を維持管理することができます。

ファイアウォールログとファイアウォールインサイトのモニタリング

Google Cloudファイアウォールは、Google Cloudネットワークへのアクセスを制御するセキュリティツールです。ファイアウォールログは、ファイアウォールを通過するトラフィックの詳細を記録します。ファイアウォールインサイトは、ファイアウォールログを分析して、トラフィックのパターンを識別し、潜在的なセキュリティの問題を検出するツールです。

ファイアウォールログとファイアウォールインサイトは、Google Cloudネットワークの接続性を維持管理し、トラブルシューティングを行うために使用できます。

VPNの管理とトラブルシューティング

Google Cloudでは、VPN接続の管理とトラブルシューティングを行うための次の機能を提供しています。

VPNトンネルのモニタリング：Google Cloudは、VPNトンネルの状態をモニタリングし、接続が失われた場合に通知します
VPNトンネルの復旧：Google Cloudは、VPNトンネルが失われた場合に、自動的にトンネルを復旧します
VPNトンネルのログ記録：Google Cloudは、VPN トンネルのすべてのトラフィックをログに記録します

これらの機能を使用して、VPN接続を常に監視し、問題が発生した場合に迅速に解決することができます。

VPN接続の接続性を維持するためのその他のヒントは次のとおりです。

最新のVPNソフトウェアを使用していることを確認します
VPNトンネルの両端で同じIPアドレスとポート番号を使用していることを確認します
VPNトンネルの両端でファイアウォールルールを構成していることを確認します

これらのヒントに従うことで、VPN接続の接続性を維持し、問題が発生した場合に迅速に解決することができます。

Cloud RouterのBGPピアリング問題のトラブルシューティング

Cloud RouterのBGPピアリング問題をトラブルシューティングする方法はいくつかあります。

BGPピアリング設定を確認
Cloud RouterのBGPピアリング設定が正しく構成されていることを確認します。これには、正しいIPアドレス、ポート、AS番号、パスワードの使用が含まれます。
BGPピアリング接続のステータスを確認
Cloud Consoleまたは gcloud CLIを使用して、BGPピアリング接続のステータスを確認します。接続がUP状態にない場合は、何が原因で接続が失敗しているかを特定する必要があります。
ネットワークトラフィックを監視
Cloud Loggingを使用して、ネットワークトラフィックを監視します。これにより、BGPピアリング接続で発生している問題のトラブルシューティングに役立ちます。

レイテンシとトラフィックフローのモニタリング、管理、トラブルシューティング

ネットワークのスループットとレイテンシのテスト

ネットワークのスループットとレイテンシのテストについて説明します。

ネットワークのスループットとは、ネットワークが一定時間内に転送できるデータ量のことです。スループットは、ビット/秒 (bps)、キロビット/秒 (Kbps)、メガビット/秒 (Mbps)、ギガビット/秒 (Gbps) などの単位で表されます。

スループットは、ネットワークの帯域幅、ネットワークの混雑状況、サーバーの性能などによって異なります。ネットワークの帯域幅が広いほど、スループットは高くなります。また、ネットワークが混雑しているほど、スループットは低くなります。サーバーの性能が低いほど、スループットは低くなります。

ネットワークレイテンシとは、データが送信元から受信先に到達するまでの時間です。ネットワークレイテンシは、ネットワークの帯域幅、ネットワークの混雑状況、サーバーの性能などによって異なります。

ネットワークレイテンシを測定する方法には、いくつかあります。ここでは、pingコマンドとnetperfコマンドについて説明します。

pingコマンド

pingコマンドは、特定のホストにICMPパケットを送信し、応答時間を測定します。pingコマンドは、次のコマンドを使用して実行できます。

ping [ホスト名またはIPアドレス]

たとえば、次のコマンドは、サーバーのIPアドレス[192.168.1.1]にpingを送信します。

ping 192.168.1.1

このコマンドを実行すると、次の出力が表示されます。

Pinging192.168.1.1 with 32 bytes of data:

Reply from 192.168.1.1: bytes=32 time=1ms TTL=128

Reply from 192.168.1.1: bytes=32 time=2ms TTL=128

Reply from 192.168.1.1: bytes=32 time=3ms TTL=128

Reply from 192.168.1.1: bytes=32 time=4ms TTL=128

Ping statistics for 192.168.1.1:

Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 1ms, Maximum = 4ms, Average = 2ms

pingコマンドの出力には、次の情報が含まれます。

ホスト名またはIPアドレス
パケットの送信数
パケットの受信数
パケットの損失数
平均応答時間

netperfコマンド

netperfコマンドは、指定されたIPアドレスにTCPパケットとUDPパケットを送信し、応答を待つコマンドです。netperfコマンドの応答時間は、ネットワークレイテンシのより正確な指標となります。

netprefコマンドを実行すると、次の情報が表示されます。

スループット (bps)
レイテンシ (ms)
エラー数

netprefコマンドを使用して、ネットワークのスループットとレイテンシを測定することで、ネットワークのパフォーマンスを改善することができます。

たとえば、netprefコマンドで、サーバーのIPアドレスが192.168.1.1の場合、次のコマンドを実行します。

netpref -s 192.168.1.1 -t TCP -c 10000 -l 1024 -r 10

このコマンドを実行すると、次の情報が表示されます。

sending 10000 bytes in 1024 byte bursts

Throughput: 10000000 bytes/sec
Latency: 100.00 ms
Errors: 0

この結果から、サーバーのスループットは10Mbps、レイテンシは100msであることがわかります。

ネットワークレイテンシを測定するには、pingコマンドとnetperfコマンドを使用します。pingコマンドでは、ネットワークレイテンシの概要を把握できます。netperfコマンドでは、ネットワークレイテンシのより正確な値を把握できます。

ネットワークレイテンシを測定することで、ネットワークのパフォーマンスを改善することができます。

ルーティングの問題の診断

Google Cloudでは、レイテンシとトラフィックフローをモニタリング、管理、トラブルシューティングするために、次のリソースを提供しています。

Cloud Monitoring
Cloud Logging
Cloud Trace

これらのリソースを使用して、ルーティングの問題を診断できます。たとえば、Cloud Monitoringを使用して、特定のルート経由のトラフィックのレイテンシを監視できます。また、Cloud Loggingを使用して、ルーティングの問題に関するログメッセージを収集できます。さらに、Cloud Traceを使用して、ルーティングの問題が発生したときにアプリケーションのパフォーマンスをトラブルシューティングできます。

ルーティングの問題を診断する際には、次の点を考慮してください。

ルート経由のトラフィックのレイテンシ
ルーティングの問題に関するログメッセージ
アプリケーションのパフォーマンス

これらの点を考慮することで、ルーティングの問題の原因を特定し、解決することができます。

以下に、ルーティングの問題の診断の例をいくつか示します。

特定のルート経由のトラフィックのレイテンシが非常に高い場合、そのルートが過負荷になっている可能性があります。この場合、トラフィックを他のルートに分散することで、問題を解決できます。
ルーティングの問題に関するログメッセージが大量に発生している場合、ルート設定に問題がある可能性があります。この場合、ルート設定を確認して、問題を解決してください。
アプリケーションのパフォーマンスが低下している場合、ルーティングの問題が原因である可能性があります。この場合、ルーティングの構成を確認して、問題を解決してください。

ルーティングの問題の診断は、複雑な作業になる場合があります。しかし、上記のリソースを使用することで、問題の原因を特定し、解決することができます。

Network Intelligence Center を使用したトポロジの可視化、接続のテスト、パフォーマンスのモニタリング

Network Intelligence Center (NIC) は、Google Cloudネットワークのトポロジ（接続方法）、パフォーマンス、およびトラフィックフローに関するインサイトを提供します。NICを使用すると、次のことができます。

ネットワークトポロジを可視化：NICを使用すると、Google Cloudネットワークのトポロジを可視化できます。これにより、ネットワークデバイス、ネットワークリンク、およびネットワークポリシーの関係を理解することができます。
接続をテスト：NICを使用すると、Google Cloudネットワーク内の接続をテストできます。これにより、接続が正常に機能していることを確認できます。
パフォーマンスをモニタリング：NICを使用すると、Google Cloudネットワークのパフォーマンスをモニタリングできます。これにより、パフォーマンスの問題を迅速に特定して解決することができます。
トラブルシューティングを実行：NICを使用すると、Google Cloudネットワークの問題をトラブルシューティングできます。これにより、問題の原因を特定し、解決策を策定することができます。

Network Intelligence Center (NIC)は、Google Cloudネットワークの可視性、モニタリング、トラブルシューティングを管理するための単一コンソールです。NICを使用すると、Google Cloudネットワークのすべての要素を1か所で表示し、パフォーマンスの問題を迅速に特定して解決することができます。