運維指互聯(lián)網(wǎng)運維,通常屬于技術(shù)部門,即運維部。運維的職責(zé)是保證服務(wù)的穩(wěn)定運行,考慮服務(wù)的可擴(kuò)展性,從系統(tǒng)的穩(wěn)定性和可運維性的角度,提出開發(fā)需求,定位系統(tǒng)的問題,并對突然出現(xiàn)的問題做到快速響應(yīng)和處理。運維的職責(zé)覆蓋了產(chǎn)品從設(shè)計到發(fā)布、運行維護(hù)、變更升級及至下線的生命周期,與研發(fā)、測試、系統(tǒng)管理同為互聯(lián)網(wǎng)產(chǎn)品技術(shù)支撐的4大部門。小伙伴們要想獲得更多網(wǎng)絡(luò)運維主要做什么的內(nèi)容,請關(guān)注我們。
運維的重點在于系統(tǒng)運行的各種環(huán)境,從機(jī)房、網(wǎng)絡(luò)、存儲、物理機(jī)、虛擬機(jī)這些基礎(chǔ)的架構(gòu),到數(shù)據(jù)庫、中間件平臺、云平臺、大數(shù)據(jù)平臺,偏重的也不是編程,而是對這類平臺的使用和管理。運維的水平可以成為衡量一個公司(it公司)技術(shù)實力的標(biāo)準(zhǔn)。
一、運維的日常工作:
1、需要對系統(tǒng)的需求和設(shè)計方案進(jìn)行分析,思考在保證穩(wěn)定性方面有哪些可以加強(qiáng)的地方,并和系統(tǒng)的研發(fā)人員進(jìn)行有效溝通
2、使用工具、或者寫程序,對運營數(shù)據(jù)進(jìn)行分析。
3、寫程序以建立工具或平臺,去加強(qiáng)系統(tǒng)的穩(wěn)定性。
運維工程師最重要的是會運用編程和軟件的方法來解決問題。發(fā)展的道路應(yīng)該和軟件工程師沒有很大的區(qū)別,差異只是關(guān)注點和領(lǐng)域方向的不同。
二、運維需要掌握如下幾個衡量指標(biāo)
1.平均故障間隔時間( mtbf)
平均故障間隔時間(mtbf, mean time between failure),指相鄰兩次故障之間的平均工作時間。mtbf通常是衡量一個產(chǎn)品可靠性的指標(biāo),這個間隔時間越短說明系統(tǒng)可靠性越差。
2.平均修復(fù)時間(mttr)
平均修復(fù)時間(mttr, mean time to repair),指產(chǎn)品由故障狀態(tài)轉(zhuǎn)為工作狀態(tài)時修復(fù)時間的平均值,即故障修復(fù)所需要的平均時間。mttr值越低說明故障修復(fù)越及時。
3.可用性(availability)
可用性是系統(tǒng)架構(gòu)設(shè)計中很重要的衡量指標(biāo)。根據(jù)gb/t3187- -97對可用性的定義,可用性是指在要求的外部資源得到保證的前提下,產(chǎn)品在規(guī)定的條件下和規(guī)定的時刻或時間區(qū)間內(nèi)處于可執(zhí)行規(guī)定功能狀態(tài)的能力。它是產(chǎn)品可靠性、維修性和維修保障性的綜合反映。
三、運維是做什么的
運維的主要職責(zé)是在產(chǎn)品生命周期的各個階段,維護(hù)系統(tǒng)的穩(wěn)定性。運維的職責(zé)覆蓋了產(chǎn)品從設(shè)計到發(fā)布、運行維護(hù)、變更升級及至下線的生命周期,在產(chǎn)品生產(chǎn)環(huán)境各個階段的職責(zé)也不同。
運維工程在國內(nèi)也被稱作sre,直接翻譯為網(wǎng)站可用性t程。srft程師需要具備算法、數(shù)據(jù)結(jié)構(gòu)、編程能力、網(wǎng)絡(luò)編程、分布式系統(tǒng)、可擴(kuò)展架構(gòu)、故障排除等各方面技能,其核心工作包括容量規(guī)劃與實施、服務(wù)集群維護(hù)、系統(tǒng)容錯管理、負(fù)載均衡、監(jiān)控系統(tǒng)以及值班等,最終為產(chǎn)品上線后服務(wù)的穩(wěn)定性負(fù)責(zé),但是不負(fù)責(zé)具體的機(jī)器運維。小伙伴們要想獲得更多網(wǎng)絡(luò)運維主要做什么的內(nèi)容,請關(guān)注我們。