(インフラエンジニア:2年目)2017年の振り返り

投稿者: | 2017年12月31日

みなさんこんにちは。ヒロウミです。

社会人2年目となった2017年も終わりとなります。底辺インフラエンジニア(果たして本当にインフラエンジニアと名乗っていいレベルなのだろうか。。。。)である私が、1年とちょっと実際の現場で起こったことなんかを中心に感じたことをまとめてみたいと思います。

同じような立場の方、また、これからIT業界で働いて行かれる方の参考になれば幸いです。これから書く内容を要約すると「システムは運用を第一に考えよう」ということです。「何を基本的なことを言っているんだ!!」というお叱りの言葉も聞こえてきそうですが、実際にそうでない現場で働いている方に向けて書きたいと思います。

運用は辛い


まさにタイトル通りなのですが「運用は辛い」です。さらに付け加えると「運用を考えないで作られたシステムは恐ろしい」です。私は課題の山積しているシステムの運用を4つほど担当しています(なぜこんなに担当させらているのかは不明。。。。)。それぞれ週に1~2回ずつ、復旧に早くて1時間遅いと1日を要するような障害が発生します。その度に私は別の作業を中断し復旧作業に追われることとなります。復旧が完了すると止まっていた別の作業に戻らなければならないため、まともに障害の根本原因を特定する時間がなく類似の原因で別の日にまた障害が発生するというアホみたいなことを繰り返していました。

障害が発生する原因は様々ですが中には、障害が発生していたことにすら気づかないというとてもマズイものもあります。基本的に統合監視ソフトを導入しシステムを監視しているのですが、大量のアラートメールのなかに重要なメールが埋もれてしまい復旧の初動が遅れたり、そもそも監視項目が設定されていなかったりと後手後手の運用となってしまっています。

そんな劣悪な運用をやっていると毎朝会社に行くのが非常に怖くなっていきます。毎日電車の中で「今日も障害対応に追われるのか」と考えただけでお腹が痛くなったり気分が悪くなったりと非常に辛いものとなっていきます。そういった現状を変えようと監視項目を追加したり、障害の恒久対応を行なったりとできる範囲で対応をするのですがそれでもなかなか現状は改善されずそれがさらに絶望感を増大させます。私は運用を専任でやっているわけではなく、ほぼ片手間でやるような感じになっているのもとてもマズイ状況を作っている原因となっています。

基本的に別の構築・開発・顧客対応も行なっておりそちらがメインの業務となっているのですが、運用に足を引きずられる形でそちらの進捗も悪くなって行くという悪循環を生んでいる状況です。

さて「何をうだうだ愚痴を言っているんだ!!」とか「こんなことを書いている暇があるなら監視や運用の勉強をしろ!!」とかお叱りの言葉が聞こえてきそうなので私の現状説明はこの辺にして、皆さんにお伝えしたいのは、「プロジェクト中に運用の視点を少しでも取り入れてみては?」ということです。すでに「そんなの当たり前だろ!!」というような方は本ブログを閉じている頃だと思うので、そうではない皆さんに伝えたいと思います。最近ではDevOpsやInfrastructure as Code など運用を改善する概念が多く出てきています。そう言ったものを学び運用の現場に少しずつ浸透させて行くのが現状を打破する方法ではないでしょうか。

私は自分にそう言い聞かせて現状を改善させようとしている最中です。「辛い運用」「逃げ出したい運用」から「自信を持ってシステムを利用してもらえる運用」になっていければと思います。

2018年はプライベートも充実させ技術的にも飛躍できる1年になるように努力していこうと思います。あぁのんびり自由に暮らしたいなーー