日前有機會和一位德美的雙料博士交流了工業大數據的應用問題,有些感想。
美德在工業大數據的理論研究、工程應用方面已有多年的探索,并形成了一批可觀的成果。在國內,工業大數據的應用還剛剛啟步,這其中有許多問題需要思考和應對。
對大數據的定義可謂五花八門,筆者認為:
大數據是用數字表征現實世界和描述虛擬世界的數據集合。它具有以下的特征:
在時間、空間和特征等維度上使現實世界表征的顆粒度極度細化
有可能任意描述虛擬世界
很明顯,大數據是超維度的,其在時間維、空間維、特征維上的超越將改變我們對現實世界的認知和表征,并有可能從根本上改變我們的思維方法。
大數據的這些特征,在工業領域的大數據實踐中,已顯端倪。
在工程現場我們經常會發現許多看似無法解釋的現象,這種所謂的無法解釋是我們對系統理解的不到位。大數據能幫我們從全新的角度去理解系統

基于假設(包括模型)構建的數字執行系統(一級系統),也許并不能實現最優操作。在今天的工程實踐中,許多時候是用人的參與在進行優化決策。如果能基于大數據和人工智能,就能形成全新模型優化控制系統(MOS:Model optimization system)(二級系統)
對虛擬世界的描述,將實現虛實對應、虛實互動,以及虛實相驅。這更有可能讓我們超越時間維、空間維和組合方法,在前所未有的維度上構建、分析和評估系統
現代工業,可以說沒有機會犯錯誤,或者說是不允許犯錯誤。它更是質量、成本、效率綜合最優的融合體,在這一點上,大數據將大展身手。
更細的顆粒度,使我們不僅能對現有模型的精準程度有更深的了解,更有可能對質量和缺陷的趨勢有更為精準的掌控,即對系統不確定性的掌控
大數據分析將促使基于知識的控制模型得以重構,這是一個面向系統不確定的優化控制模型和面向細化特征維度的全新控制和表述模型
基于大數據的分析和建模工具應用,將實現控制和表述模型的個性化
但是,大數據的分析更多地會依賴人工智能,其決策過程的內在基理從某種角度對應著風險,正是由于新的控制和表述模型會在許多時候修正甚至顛覆我們現有的知識和知識體系,因此,如何控制大數據的應用風險,特別是極致指標下的應用風險,將是目前工業大數據應用的一個軟肋,因為未來工業不允許出錯,這也許是企業應用中最為關心的一個問題。
大數據應用的風險來源于數據的精準與不確定性、數據的安全性、數據分析和建模方法的內在基理、特征識別和參數界定的不確定性,以及驗證方法及不確定性。在這一點上,《ISO 18238 Space systems-Closed Loop Problem Solving Management(航天質量問題歸零管理)》的思路也許可以借鑒。
總之,工業大數據的應用還剛剛開始,有太多的問題需要去思考。
此文是對上述相關問題的不專業和初步的研討,以期引起相關討論,特別是應用層面的討論。
文章來源:點滴方圓