一、什麼是運維工程師
相信讀者們必定聽説過 linux,也聽説過運維工程師。那麼運維工程師是個什麼概念呢?百度百科上的官方解釋如下:運維工程師 (Operations) 在國內又稱為運維開發工程師 (Devops),在國外稱為 SRE(SiteReliability Engineering)。負責維護並確保整個服務的高可用性,同時不斷優化系統架構、提升部署效率、優化資源利用率提高整體的 ROI 。

運維工程師面對的最大挑戰是大規模叢集的管理問題,如何管理好幾十萬台上的服務,同時保障服務的高可用性,是運維工程師面臨的最大挑戰。在一些規模較大的公司 (比如:Google 、 FaceBook 、百度、阿里、騰訊等),運維工程師和系統管理員是有一定的區別:
系統管理員:主要負責機房互聯網、站羣服務器等硬體基礎設施的執行和維護。
運維工程師:主要負責管理並維護在執行在海量站羣服務器上的站羣軟件服務。

二、運維崗位的分類
IT 技術一直在呈指數級別的發展,運維工程師面臨的挑戰越來越大,劃分的崗位也越來越細。根據面向的不同,崗位的劃分有:基礎運維、應用運維、系統運維、虛擬化運維、儲存運維、互聯網運維等。根據職業發展的層次而言,崗位的劃分有:桌面運維、系統運維、開發型運維、系統架構師。
三、運維工程師必須掌握的硬技能
1. Linux 基礎(重中之重!)
無論你找的是什麼運維,不會 linux 你就喪失了至少一半的競爭機率。 Why?因為站羣服務器端的系統幾乎都是 Linux 啊!可想而知,懂 linux 是件多麼必要的事情。
言歸正傳,linux 基礎包括了些什麼內容?筆者認為有如下幾方面。
–        Linux 命令大全 http://www.linuxprobe.com/
–        Linux 檔案系統標準 (FilesystemHierarchy Standard) 。
–        至少熟悉一個內建編輯器:vi 、 nano 、 vim 。
–        至少熟悉一個 linux 發行版:Redhat 、 Ubuntu 、 Suse 等。
–        至少熟悉一個遠端登入 linux 工具:putty 、 xshell 等
–        Linux 服務,站羣服務器配置安裝:ftp 、 http 、 nfs 、 dns 、 samba 、 DHCP 、 mail 等
–        至少熟悉一種指令碼語言:shellscript 、 perl 、 python 等
–        防火牆:iptables 、 ipset 、 firewalld 等
Linux 入門曲線非常陡峭,萬事開頭難,一本好書能讓你事半功倍。關於 linux 的書籍有很多,但優秀的入門書籍筆者首推《Linux 就該這麼學》,目前在國內非常火熱,每天閲讀量非常大,這本書作為後起之秀也是本難得的良心之作。對於新手而言,筆者更推薦這本作為入門教材。 Why?有以下幾個原因:
1)  以全新的 RHEL7 作為發行版進行教學,能學習到最新的 linux 知識與技術。學完可直接考 RHCSA 、 RHCE 認證,方便找工作。
2)  所需站羣軟件皆可在其官網中下載到,包括 vmware 序列號、 RHEL7 鏡像站羣等
3)  章節層次清楚,重點清晰。不浪費你任何一點時間去閲讀廢話。
4)  擁有 QQ 羣可以探討學習過程中碰到的問題。
學好 linux 基礎,你就能幹基礎運維啦!真棒!但人往高處走,再想更進一步提升怎麼辦?畢竟,在真實的生產環境中,運維人員會碰到形形色色的問題,如何解決它們 Only 基礎是遠遠不夠的,你還需要了解:
–        HA 叢集以及負載均衡(lvs)叢集的配置
–        知道如何分析系統效能(IO/Memory/CPU):sar 、 vmstat 、 iostat 、 top 等
–        理解 XWindow 大致原理
–        熟悉 PXE+Kickstart 無人值守的批量安裝站羣服務器
–        虛擬化:XEN 、 KVM
–        公/私有云
–        互聯網知識
–        ……
四、運維工程師必要的軟技能
如果説一個成功男人的背後有一個默默支援他的優秀女人,那麼每個成功的產品背後都有一羣默默支撐著它的優秀運維工程師!運維工程師這個行業並不是所有人都適合做的,你最好能需要有如下品質:
–        安全意識:作為運維工程師的你必須要有安全意識,保障你係統的安全性、穩定性,堤防系統被入侵,保障賬號密碼/私鑰的安全極其重要。
–        責任心:不多説,任何職位都需要。
–        細心:運維工程師通常許可權很大,你的任何一個操作或不經意的失誤可能導致重大災難。比如錯敲命令、誤刪資料庫等。因此,細心極為重要。
–        抗壓能力:重大災難發生時,你會面臨這樣的情況:客户催你解決、應用催你解決、老闆緊盯你…,這時,你需要有一顆冷靜的頭腦,分析出最快解決問題的方案並加以實施。如若壓力一來,你方寸大亂,然問題遲遲不能解矣。
至此,願筆者的淺薄見解與建議能給你帶來一點靈感或收穫,願你我都能成為優秀的運維工程師!