近日,互聯網行業的系列故障觸動著大眾神經,各大網站似乎從來都沒有過如此神經衰弱的一刻。
故障頻發,伴隨著各種猜測、分析、蜚語、流言將各大網站推上風口浪尖。然而,服務已經陸續恢復,不管原因是官方公布的理由也好,坊間傳聞的陰謀詭計也罷。我們要做的其實不是一起笑看今朝,而是思考如何避免類似情況的再次發生。我們冷靜下來想一想,同類事件若發生在自己身上,我們該做什么。
我們可以去招聘一個亙古罕見的技術狂人,或者拿藐視GDP的工資去吸引一個運維大仙,抑或每天早祈禱晚祝福的教育每個員工不要干出格之事,要不干脆去制定冗長的流程,每個操作都要經過員工提出,CTO批準,董事會討論,股東投票表決。但是,驀然回首,我們會發現早有更成熟的方法在早在燈火闌珊處。
現在,讓我們把各種可能的意外都用云的眼光來審視一下,你會發現,這一切都可以優雅的解決。
意外一:挖掘技術哪家強,一門心思挖機房
互聯網如火如荼的發展,怎奈不敵傳統行業一鏟子。若不幸被宇宙最強武器擊中機房,那么此刻云是如何做的呢?
騰訊云機房相互以兩條以上光纖互聯。看似一個大區的服務器,其實分布在同城的不同的IDC,若一條光纖被挖斷、抑或是老鼠螞蟻等各種小動物調皮,數據都將從另外的光纖通到其他機房,然后再出口到外網。最重要的是,整個切換過程不用兩天,不用兩小時,秒級完成切換,這就是騰訊云獨家技能——跨域流量調度。
意外二:代碼被刪
眾所周知,代碼管理會有專門的一些軟件,例如SVN或者GitHub。若僅僅是服務上的代碼被不小心刪除,若有成熟的發布系統,應該能很快恢復服務。
但若是故意刪除,就麻煩許多。
但不管是否故意為之,若使用騰訊云可以這樣解決:對穩定版本做服務器鏡像,該鏡像會被多份冗余保存。以后不管是代碼被刪也好,服務器被物理損壞也好都可以快速的恢復鏡像,只需幾分鐘。
意外三:批量導入誤操作,數據被刪
若是內部人員誤操作,把數據刪了,而且是運維同學運行了批量腳本,該怎么辦?
在騰訊云,意外可以避免。騰訊云CDB全新推出批量導入功能,可以在前臺頁面批量執行SQL語句,同時會做相應危險提示,若是開發運維同學不小心敲出個逆天的危險命令,剛點執行,這個時候才反映過來這行命令將改變歷史。正在追悔莫及時,頁面彈出一個對話框,“該命令包含危險數據操作,您確定要執行嗎?”。世界一下就變得和藹可親了。
意外四:內鬼破壞,格式化硬盤、刪除所有數據
最先在各群里傳播的謠言就是,內部人員,離職人員把數據物理刪除了。聽到這個消息后,大家只能仰天長嘯了。假如真有一天,哪位同學受到不明宇宙射線影響,干出此等謬事,云能夠如何應對?
如果用戶把數據存放在了騰訊云數據庫(CDB),若想登錄到物理機上,直接對硬盤進行低級格式化,那么非常抱歉,您是沒有這個權限的。使用騰訊云CDB的開發商,只能看見數據庫,無法登錄數據所在的物理機。騰訊內部的開發人員、運維人員也沒有此等逆天權限。而且內部審計會隨時盯著各種命令,一有風吹草動便會發現。
那如果一個內鬼用極高權限的用戶,直接刪除所有表,隨后揚長而去呢?
對于騰訊云CDB,由于CDB采用冷備和binlog備份數據,當災難發生時,可以恢復5天內任意時間點的數據,就像什么都沒發生,內鬼的陰謀將輕易被挫敗。此外,騰訊云高性能版數據庫,數據恢復時可達到單機數萬次每秒的寫入能力。騰訊云CDB不懼怕內鬼的蓄意破壞。
意外五:黑客入侵,蓄意破壞數據
我們假設MySQL本身有嚴重漏洞,黑客掌握了這個信息后,準備刪除他們使用的騰訊云CDB,抑或并不刪除,只是把數據弄亂。那么普通的運維團隊可能很難與這幫黑客糾纏。但騰訊云CDB的專業運維人員,都是久經沙場的互聯網老將,深諳數據攻防與保護之道,也建立了完善的監控和告警機制,可以讓每個使用騰訊云CDB的開發商都享受國內一等一的數據保護能力。
意外搞出個大新聞,初看之下,可能是錯在把數據、代碼刪了,要不就可以怪內鬼、怪黑客、怪挖掘機。但一推敲,將會發現錯在沒選擇更優雅的公有云。有些時候,選擇比努力更重要。生活經不起天天如此這般的折騰,騰訊云,可以提供更優雅的避免方案,這才是每個企業IT人員最安全穩妥的生活方式。
(新聞稿 2015-06-01)