對(duì)糾正措施必須進(jìn)行追蹤,直到執(zhí)行完成。要記住,在糾正措施沒有得到完全執(zhí)行之前,事故重發(fā)的風(fēng)險(xiǎn)會(huì)一直存在。必須確保執(zhí)行人和完成日期都落實(shí)到位,而且執(zhí)行人要一直負(fù)責(zé)到底,哪怕原來的事件已逐漸成為過去。要在錯(cuò)誤追蹤系統(tǒng)或其他類似工具中將其標(biāo)記為高優(yōu)先級(jí)項(xiàng)目,這樣有助于確保正確的信息都記錄下來了,從而避免丟失。
改正性活動(dòng)常常會(huì)和開發(fā)活動(dòng)競(jìng)爭(zhēng)資源的優(yōu)先權(quán)屬。對(duì)于網(wǎng)站的穩(wěn)定性和新功能,在重要程度上給予同等對(duì)待,在這點(diǎn)上取得管理層的支持,非常重要。聲稱網(wǎng)站穩(wěn)定性最重要的公司,對(duì)于確保改正性活動(dòng)的完成,大有幫助。糾正措施要根據(jù)能夠防止的類似事故的數(shù)量來確定優(yōu)先順序,假如一項(xiàng)措施只能糾正當(dāng)前發(fā)生的事故,而另一項(xiàng)措施卻能修復(fù)一批可能的類似事故,則肯定后者會(huì)得到更高的優(yōu)先級(jí),從而工程部門也會(huì)將精力集中在這項(xiàng)措施上。
另外,確保將事后分析的數(shù)據(jù)錄入到最終工具中,為事件賦予一個(gè)根本原因類別,以便對(duì)其進(jìn)行數(shù)據(jù)挖掘,從而管理層也能夠?qū)﹂L期趨勢(shì)進(jìn)行識(shí)別。我們使用這樣的事故類別,如硬件失效、與更新有關(guān)、容量/流量事故、已存在的軟件錯(cuò)誤,對(duì)事故進(jìn)行歸類。使用歷史數(shù)據(jù),對(duì)申請(qǐng)哪些資源、使用什么樣的工具、啟動(dòng)什么樣的自動(dòng)化項(xiàng)目進(jìn)行更加明的策。要將資源用在多發(fā)的事故類別上,從而在整個(gè)公司范圍內(nèi)有組織地降低這些事故的發(fā)生率。有宕機(jī)的歷史數(shù)據(jù),對(duì)于調(diào)整有難度、耗資源的項(xiàng)目是特別有用的。
經(jīng)過了多年的事后分析經(jīng)歷,我發(fā)現(xiàn)了一些內(nèi)容,你可能會(huì)考慮將其用于改正性活動(dòng),我稱其為網(wǎng)站可操作性。
消除單點(diǎn)故障硬件可能,也將會(huì),失效。使用冗余進(jìn)行防護(hù)。不要讓硬件失效成為發(fā)生影響客戶的事件的原因。
容量規(guī)劃了解網(wǎng)站將來的容量需求。將容量規(guī)劃建立在主要的約束條件(如CPU、內(nèi)存、I/O及存儲(chǔ))的整體利用率的基礎(chǔ)上,而不要建立在次要約束條件(如用戶數(shù)量)的基礎(chǔ)上。對(duì)于這些你所需要的東西,要在需要之前,就做好預(yù)備。
監(jiān)控監(jiān)控對(duì)于檢測(cè)和診斷事故是非常重要的。本書的其他章節(jié)對(duì)于監(jiān)控已經(jīng)提供了大量的建議。
發(fā)布管理從歷史上看,更新是引發(fā)事故的主要原因。要確保你的發(fā)布過程具有適當(dāng)?shù)馁|(zhì)量控制,要考慮這樣的實(shí)現(xiàn)概念,如自動(dòng)測(cè)試、預(yù)演環(huán)境、受限的生產(chǎn)部署、暗啟動(dòng)(部署代碼,但不激活其功能,直到證明代碼是穩(wěn)定的)以及立即回滾的能力。
運(yùn)維架構(gòu)復(fù)審在發(fā)布之前,對(duì)架構(gòu)進(jìn)行復(fù)審,對(duì)新的發(fā)布或產(chǎn)品在生產(chǎn)環(huán)境中將會(huì)如何執(zhí)行進(jìn)行審查,要考慮可維護(hù)性、失效場(chǎng)景、對(duì)事件的響應(yīng)以及架構(gòu)的可靠性和可伸縮性。
配置管理隨著系統(tǒng)的增長,生產(chǎn)環(huán)境中的配置也會(huì)變得越來越復(fù)雜。無法理解更新對(duì)生產(chǎn)配置的意義往往會(huì)導(dǎo)致人為事故的發(fā)生。有一個(gè)易懂、好用的配置管理系統(tǒng),將有助于工程師避免這些無意中發(fā)生的問題。請(qǐng)參閱本書第5章,查看更多的建議。
隨時(shí)待命和提升過程識(shí)別問題,盡快提交給能夠解決問題的人。
不穩(wěn)定的組件標(biāo)識(shí)并修復(fù)那些發(fā)生過崩潰以及人為事故的軟件組件,將其標(biāo)識(shí)為高優(yōu)先級(jí),即使它們易響于手工修復(fù)。這些手工修復(fù)累積起來,會(huì)對(duì)客戶體驗(yàn)、伸縮能力以及效能都造成負(fù)面影。
要采取積極主動(dòng)的行動(dòng),確保
網(wǎng)站建設(shè)內(nèi)容的可操作性,能避免很多痛苦的事后分析。
分享題目:事后分析的后續(xù)工作有哪些?
當(dāng)前路徑:http://m.newbst.com/news37/146187.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、手機(jī)網(wǎng)站建設(shè)、服務(wù)器托管、云服務(wù)器、全網(wǎng)營銷推廣、網(wǎng)站建設(shè)
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源:
創(chuàng)新互聯(lián)