どうもオカモトです。
以前ブログで、システムリプレース後にデータベースに不整合がみつかり
修正作業をしなければならない状況が怖いと書きました。
つい最近、以下の記事を見つけました。
[京大スパコンのデータ77TBが消失 バックアップ処理中に不具合]
https://www.itmedia.co.jp/news/articles/2112/29/news040.html
バックアップ処理スクリプトを実行中に修正してしまい、
bashがスクリプトファイルを適宜参照して、
未定義の変数が含まれたfindコマンドが実行された事が原因との事です。
<引用>
https://xtech.nikkei.com/atcl/nxt/column/18/01157/012700053/
こんな大規模なシステムは扱ったことはありませんが、
明日は我が身と思うと、ぞっとします。
ヒューマンエラーはどうしても起こるので、
最近は「自動化」が主流になっているらしいですが、
やっぱり起こるものは起こるのですね。。。
77TB消失のうち、28TBは復旧不可能とのことで、
2系統以上のバックアップが必要との意見もネットで拝見しました。
データは「研究者が学術論文のために使う重要データ」との事で
何年もの研究成果が、無くなってしまったのかと思うと、
なんともいえない気分になります。