這些年來(lái),由于信息爆發(fā)式的飛速增長(zhǎng),讓我們進(jìn)入了真正的大數(shù)據(jù)時(shí)代,而大數(shù)據(jù)無(wú)疑是目前it行業(yè)中炙手可熱的詞匯,它是指需要處理的數(shù)據(jù)規(guī)模巨大,產(chǎn)生速度快,具有一定的實(shí)時(shí)性,數(shù)據(jù)格式具有多樣性,同時(shí)數(shù)據(jù)中具有重要的商業(yè)、社會(huì)或科學(xué)等方面的價(jià)值,但有效的信息密度相對(duì)較低,這樣的數(shù)據(jù)通過(guò)常規(guī)的方法已無(wú)法處理,必須借助于一種前所未有的方式,通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行分析,以獲得有巨大價(jià)值的產(chǎn)品和服務(wù),或深刻的洞察力,以及全新的商業(yè)模式。大數(shù)據(jù)的思維也許會(huì)給我們帶來(lái)新的思考。
大數(shù)據(jù)的本質(zhì)是思維方法、商業(yè)、和管理領(lǐng)域前所未有的大變革。它包含了三個(gè)重要的思維轉(zhuǎn)變:
a.要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本
b.要接受數(shù)據(jù)的紛繁復(fù)雜,而不再僅僅追求精確性
c.追求事物的相關(guān)關(guān)系勝過(guò)追求因果關(guān)系
目前,國(guó)內(nèi)大多數(shù)的工業(yè)應(yīng)用中的scada都會(huì)進(jìn)行歷史數(shù)據(jù)歸檔,很多項(xiàng)目由于點(diǎn)數(shù)很多,其歷史數(shù)據(jù)量都不算小,但這些歷史數(shù)據(jù)大多只是用來(lái)產(chǎn)生班報(bào)、日?qǐng)?bào)、月報(bào)、年報(bào)等生產(chǎn)報(bào)表,或者用來(lái)追溯事故原因、責(zé)任等基本功能。就單個(gè)監(jiān)控系統(tǒng)的歸檔數(shù)據(jù)量來(lái)看,因?yàn)橐话闼鼈兺ǔ6际菃我坏年P(guān)系型數(shù)據(jù)庫(kù),這些數(shù)據(jù)大多都可以在單臺(tái)服務(wù)器上,用較短的時(shí)間被處理完,故還無(wú)法被看作真正的大數(shù)據(jù)的應(yīng)用。大多數(shù)需求是基于傳統(tǒng)的數(shù)據(jù)分析和處理方法來(lái)完成。比如:降能耗成本的能耗分析、降低次品率的質(zhì)量控制、降低停機(jī)和等待時(shí)間的智能設(shè)備維護(hù)、提高工藝工序效率的工藝參數(shù)比較等方面。
在大數(shù)據(jù)的思維里,數(shù)據(jù)被看作是新的待挖掘的油田。需要通過(guò)新的視角分析看待這些“原油”,發(fā)現(xiàn)它所蘊(yùn)藏的更大的潛在價(jià)值。而這些專業(yè)的數(shù)據(jù)處理手段,需要借助mapreduce\hadoop等it技術(shù)、模型和分布式架構(gòu)來(lái)支撐,同時(shí),需要有對(duì)數(shù)據(jù)和業(yè)務(wù)間的關(guān)聯(lián)關(guān)系有很強(qiáng)的分析能力。下圖反映出了大數(shù)據(jù)在美國(guó)制造領(lǐng)域使用的難度大,價(jià)值潛力相對(duì)不高的現(xiàn)狀。故大數(shù)據(jù)在工業(yè)生產(chǎn)領(lǐng)域的應(yīng)用方向、方法、可行性和投入產(chǎn)出比等方面,是目前都需要我們考慮的幾個(gè)重要的問(wèn)題。
雖然工業(yè)領(lǐng)域的大數(shù)據(jù)應(yīng)用較電子商務(wù)、金融等領(lǐng)域還有一定較大差距。但大數(shù)據(jù)思想還是非常值得我們?nèi)ソ梃b。
對(duì)于scada,數(shù)據(jù)采集和監(jiān)控系統(tǒng),我們可以分兩部分來(lái)看大數(shù)據(jù)思想對(duì)于scada提出的新要求和新挑戰(zhàn)。
從大數(shù)據(jù)的產(chǎn)生到使用的過(guò)程來(lái)看,可以簡(jiǎn)單分為三個(gè)不同的階段:數(shù)據(jù)采集,大數(shù)據(jù)分析挖掘,(處理結(jié)果)數(shù)據(jù)展示。scada在第一階段和第二階段可以參與其中,發(fā)揮自身的優(yōu)勢(shì),但真正的大數(shù)據(jù)挖掘并不是scada所關(guān)注的,而是應(yīng)該交由其他專業(yè)系統(tǒng)完成。
大數(shù)據(jù)思想在數(shù)據(jù)采集方面對(duì)scada的要求和促進(jìn):
a. 在大數(shù)據(jù)的應(yīng)用場(chǎng)景中,正確的決策首先需要全面、透明的了解工業(yè)過(guò)程的運(yùn)行狀態(tài),就需要scada對(duì)更多種類的傳感器信息信息進(jìn)行展示、記錄、存儲(chǔ)、調(diào)用。除了常用的電壓/電流,液位/壓力/流量/溫度,頻率/計(jì)數(shù),條碼、氣象,檢測(cè)儀表(振動(dòng)、聲音、光線、粉塵)等測(cè)量外,還可以處理視頻/視覺(jué)、3d模型等復(fù)雜數(shù)據(jù),scada系統(tǒng)需要具有更加開(kāi)放的系統(tǒng)架構(gòu),更加靈活的數(shù)據(jù)接入能力
b. 支持各種通信介質(zhì)和協(xié)議
c. 大量數(shù)據(jù)并發(fā)采集處理,必要的更快速的采集速度,更高性能、高容量的數(shù)據(jù)歸檔系統(tǒng)的支撐
d. 采集數(shù)據(jù)的前端預(yù)處理,降低后續(xù)分析、使用的處理強(qiáng)度,提高處理速度
大數(shù)據(jù)思想對(duì)監(jiān)控功能可能有以下要求和促進(jìn):
a. 需要scada系統(tǒng)更加主動(dòng)智能,可以實(shí)現(xiàn)更加復(fù)雜的計(jì)算,基于大量的數(shù)據(jù)采集感知情景,實(shí)現(xiàn)智能的連動(dòng)控制
b. 基于對(duì)大量各種數(shù)據(jù)進(jìn)行相關(guān)性分析,能夠快速輔助相關(guān)人員作出正確決策
c. 采用soa面向服務(wù)的架構(gòu)與其他it系統(tǒng)的接口(如bi、mes、移動(dòng)智能終端、甚至門戶網(wǎng)站、社交媒體等等),可以將采集或分析結(jié)果在各層、各專業(yè)間共享,將數(shù)據(jù)投放到任何真正需要的地方,讓數(shù)據(jù)帶來(lái)更多的便利,充分發(fā)揮數(shù)據(jù)的價(jià)值
d. 更友好的數(shù)據(jù)可視化手段,以更*度、視角的豐富的數(shù)據(jù)視圖、圖表,多種格式數(shù)據(jù)的聯(lián)合展示方式,虛擬現(xiàn)實(shí)、真強(qiáng)現(xiàn)實(shí)技術(shù)的使用和融入。
pvss 作為 西門子的開(kāi)放的scada系統(tǒng),可以很好應(yīng)對(duì)上述的這些挑戰(zhàn),從國(guó)內(nèi)目前的應(yīng)用案例來(lái)看,pvss比較適合大規(guī)模,超大規(guī)模的大地理域的數(shù)據(jù)采集應(yīng)用,也為各種高端復(fù)雜監(jiān)控應(yīng)用提供了高效、可靠的開(kāi)發(fā)平臺(tái)。