五個(gè)數(shù)字說(shuō)清工業(yè)大數(shù)據(jù)
要理解工業(yè)大數(shù)據(jù),筆者認(rèn)為,可以從下面幾個(gè)數(shù)字入手。
一個(gè)目標(biāo)
一個(gè)目標(biāo)就是提升智能化的水平。很多專業(yè)人士談到大數(shù)據(jù),往往局限于各種數(shù)據(jù)的分析及其算法。如果視野僅僅局限于這個(gè)層次,那么,就難以看到大的機(jī)會(huì)。
在筆者看來(lái),大數(shù)據(jù)時(shí)代的機(jī)會(huì)就在于促進(jìn)智能化水平的提高、帶領(lǐng)工業(yè)界進(jìn)入智能時(shí)代。換句話說(shuō):如果不與各種智能化工作聯(lián)系起來(lái),就可能會(huì)失去大數(shù)據(jù)時(shí)代的機(jī)會(huì)。
要認(rèn)識(shí)這種機(jī)會(huì),就需要正確把握智能化的含義。什么是智能化?智能化就是通過(guò)數(shù)字化和網(wǎng)絡(luò)技術(shù)提升信息獲取或決策的能力。而決策的主體可以是機(jī)器,也可以是人。我們知道,大數(shù)據(jù)促進(jìn)了機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,推動(dòng)了新一代人工智能(AI)的發(fā)展。但智能化的內(nèi)涵應(yīng)該遠(yuǎn)大于人工智能(AI)。只有認(rèn)識(shí)到這一點(diǎn),才能看到更多的機(jī)會(huì)和可能。
某種意義上講,智能化就是人機(jī)工作界面的改變,是借助ICT技術(shù)(信息通信技術(shù))實(shí)現(xiàn)業(yè)務(wù)活動(dòng)方式的創(chuàng)新。在信息獲取、知識(shí)獲取、決策、執(zhí)行等環(huán)節(jié),我們都可以采取新的工作方式。比如,在信息獲取方面,當(dāng)數(shù)據(jù)太多太散時(shí),可以讓機(jī)器去查找信息;數(shù)據(jù)組織得好時(shí),就可以讓人去查找信息。還比如,在知識(shí)獲取方面,可以用人機(jī)協(xié)同的方式獲取知識(shí),也可以讓機(jī)器自行去獲取知識(shí)。
可以說(shuō),在智能化方面,我們要有想象力,不要局限于從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)。比如,實(shí)現(xiàn)機(jī)器“用”知識(shí)推動(dòng)設(shè)備智能化,或直接為人類提供可用的知識(shí)?,F(xiàn)在,知識(shí)的人類用戶可以是工程師,也可以是消費(fèi)者。因此,工業(yè)大數(shù)據(jù)技術(shù)落地的前提常常是具體業(yè)務(wù)牽引,即所謂“先有需求,再找方法”。
一個(gè)基礎(chǔ)
一個(gè)基礎(chǔ)就是數(shù)據(jù)的完整性。無(wú)論是工業(yè)產(chǎn)品還是車間、工廠,工業(yè)對(duì)象往往被看成一個(gè)復(fù)雜的系統(tǒng)。當(dāng)我們用數(shù)據(jù)來(lái)表征系統(tǒng)時(shí),數(shù)據(jù)的完整性和相關(guān)性都特別重要。畢竟不完整的數(shù)據(jù)和不相關(guān)的數(shù)據(jù)可能會(huì)得出錯(cuò)誤的分析結(jié)論,而工業(yè)對(duì)象都追求高度的可靠性,對(duì)錯(cuò)誤的容忍度很低。
寶鋼老專家王洪水先生認(rèn)為:用數(shù)據(jù)記錄生產(chǎn)過(guò)程時(shí),“要向錄像機(jī)錄像一樣”把數(shù)據(jù)收集起來(lái),不要有斷點(diǎn)。這是實(shí)踐中行之有效、正確的指導(dǎo)思想。
筆者還見(jiàn)過(guò)有人在研究鋼鐵材料成分與力學(xué)性能之間的關(guān)系時(shí),把包括微合金鋼在內(nèi)的多種鋼種混在一起,卻只考慮了C、Si、Mn、S、P等所謂的“5大元素”。這時(shí)得到的結(jié)論自然就是錯(cuò)的。
過(guò)去記錄數(shù)據(jù)時(shí),由于存儲(chǔ)成本高,往往“挑重要的記錄”,導(dǎo)致記錄的信息碎片化。現(xiàn)在數(shù)據(jù)存儲(chǔ)成本低,可以記錄的數(shù)據(jù)多了,但是,若數(shù)據(jù)之間的關(guān)聯(lián)性沒(méi)有被記錄下來(lái),則數(shù)據(jù)照樣是沒(méi)有價(jià)值的。
二次應(yīng)用
在多數(shù)業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)在業(yè)務(wù)活動(dòng)中產(chǎn)生,業(yè)務(wù)活動(dòng)結(jié)束后,數(shù)據(jù)也就基本沒(méi)用了。而大數(shù)據(jù)的重要用途往往發(fā)生在業(yè)務(wù)場(chǎng)景結(jié)束之后,故而稱之為二次應(yīng)用。二次應(yīng)用的價(jià)值在于:用過(guò)去產(chǎn)生的數(shù)據(jù)讓現(xiàn)在的業(yè)務(wù)活動(dòng)做得更好。
大數(shù)據(jù)的一個(gè)重要用途是促進(jìn)企業(yè)的轉(zhuǎn)型升級(jí)、業(yè)務(wù)活動(dòng)的創(chuàng)新。然而,創(chuàng)新的成功邏輯往往是“先做成、后做好”。強(qiáng)調(diào)二次應(yīng)用,指的是把大數(shù)據(jù)應(yīng)用于“做好”的優(yōu)化階段。
在筆者看來(lái),大數(shù)據(jù)對(duì)如何“做成”業(yè)務(wù)是沒(méi)有責(zé)任的。因?yàn)闆](méi)有“先做成”的業(yè)務(wù)邏輯,大數(shù)據(jù)也就沒(méi)有辦法落地。強(qiáng)調(diào)這一點(diǎn)的原因是:把兩個(gè)困難混在一起,可能就做不成事了?!白龀伞钡臉I(yè)務(wù)邏輯必須單獨(dú)考慮、提前考慮,大數(shù)據(jù)只是讓業(yè)務(wù)“做得更好”而已。
而“做好”則包括多個(gè)方面,如質(zhì)量更好、速度更快、成本更優(yōu),而不僅僅是決策質(zhì)量更好。比如,重用知識(shí)和信息可以使人們做事的速度更快、成本更低。對(duì)于“做好”,不要一味地強(qiáng)調(diào)“決策質(zhì)量更優(yōu)”,如果僅僅局限于決策質(zhì)量,則可能會(huì)失去很多創(chuàng)新機(jī)會(huì)。
兩種承載
大數(shù)據(jù)是數(shù)據(jù)(Data),也必須是信息(Information)。兩者的差別在于:數(shù)據(jù)之間有了聯(lián)系才能構(gòu)成信息。強(qiáng)調(diào)這個(gè)觀點(diǎn)的目的在于:不要碎片化地收集數(shù)據(jù),而是去收集有聯(lián)系的數(shù)據(jù)、收集數(shù)據(jù)之間的聯(lián)系,且最好是完整的信息,而不是破碎的信息。
大數(shù)據(jù)不僅可以用來(lái)承載信息,而且可以用來(lái)承載知識(shí),也就是把知識(shí)提煉出來(lái),用大數(shù)據(jù)來(lái)承載。從工業(yè)上看,工業(yè)產(chǎn)品的設(shè)計(jì)數(shù)據(jù)和工業(yè)設(shè)備的狀態(tài)、標(biāo)準(zhǔn)等知識(shí)都可以用數(shù)據(jù)來(lái)表示。在某些個(gè)性化需求比較多的場(chǎng)景下,這些數(shù)據(jù)的量是相當(dāng)大的。上海有一家企業(yè),每天處理這類數(shù)據(jù)所花的電費(fèi)就有10萬(wàn)元。
總之,不論承載什么,都要以便于應(yīng)用為目的,不要總想著“從數(shù)據(jù)提取知識(shí)”這一件事、一個(gè)環(huán)節(jié),而是要以具體的應(yīng)用為牽引,根據(jù)具體需求,以終為始地建立大數(shù)據(jù)基礎(chǔ)。
三個(gè)優(yōu)勢(shì)
大數(shù)據(jù)的不同之處是什么?筆者將其歸結(jié)為三個(gè)優(yōu)勢(shì)。正是這三個(gè)優(yōu)勢(shì)讓我們便于從大數(shù)據(jù)中獲得知識(shí)。
筆者把第一個(gè)優(yōu)勢(shì)稱為“不必糾結(jié)于因果”。這種說(shuō)法區(qū)別于“是相關(guān),不是因果”,以及“工業(yè)大數(shù)據(jù)必須具備因果關(guān)系”。這種觀點(diǎn)的意思是:從大數(shù)據(jù)中提煉的工業(yè)知識(shí),要以因果關(guān)系的存在為基礎(chǔ),但不必按照機(jī)理邏輯去計(jì)算。比如,我們可以從數(shù)據(jù)中得到某個(gè)最優(yōu)參數(shù),但不必從理論上推導(dǎo)出來(lái)為什么最優(yōu)。不糾結(jié)于因果,可以讓知識(shí)的獲取變得簡(jiǎn)單。在這個(gè)基礎(chǔ)上,大數(shù)據(jù)可以獲得靠譜的“感性知識(shí)”“經(jīng)驗(yàn)知識(shí)”,讓知識(shí)的種類大大拓展。這是大數(shù)據(jù)促進(jìn)圖像識(shí)別等技術(shù)發(fā)展的原因之一。
第二個(gè)優(yōu)勢(shì)是“樣本=全體”。從應(yīng)用的角度看,數(shù)據(jù)的優(yōu)勢(shì)不在“多”,而在“全”?!岸唷敝粫?huì)增加計(jì)算機(jī)處理的復(fù)雜性,而“全”則保證了知識(shí)的存在性。當(dāng)數(shù)據(jù)能夠覆蓋所有場(chǎng)景時(shí),“新問(wèn)題”就變成了“老問(wèn)題”,這時(shí)我們就可以從歷史中得到所需要的經(jīng)驗(yàn)和知識(shí)。
第三個(gè)優(yōu)勢(shì)是“混雜性”。這個(gè)優(yōu)勢(shì)可以讓我們從多個(gè)角度印證知識(shí),提高知識(shí)的可靠性,但其前提是確保大數(shù)據(jù)記錄的完整性。
由此可以看出,三個(gè)優(yōu)勢(shì)的本質(zhì)都落腳在“知識(shí)的優(yōu)勢(shì)”上。
大數(shù)據(jù)的優(yōu)勢(shì)與人的作用
工業(yè)大數(shù)據(jù)并不是天生存在的,而是要人去創(chuàng)造的。比如,“樣本=全體”的內(nèi)涵是借鑒過(guò)去的經(jīng)驗(yàn)。然而,“世界上沒(méi)有兩片完全一樣的葉子”。從這個(gè)角度看,其實(shí)每個(gè)問(wèn)題都是獨(dú)特的,“樣本=全體”的理念在應(yīng)用時(shí)必然涉及個(gè)性與共性的關(guān)系問(wèn)題。借鑒過(guò)往經(jīng)驗(yàn)的前提是對(duì)問(wèn)題抽象、歸納、總結(jié)的結(jié)果——但這往往是人類才能做的事情,至少是人類告訴計(jì)算機(jī)該怎么做。而且,大數(shù)據(jù)記錄的數(shù)據(jù)畢竟屬于過(guò)去,因此,在應(yīng)用于未來(lái)時(shí),必須有辦法來(lái)提高其可靠性。
再如,“不糾結(jié)于因果”的前提是以因果關(guān)系的存在為基礎(chǔ),只是不必按照因果邏輯去推導(dǎo)、計(jì)算。但是,因果關(guān)系是具有專業(yè)知識(shí)的人用專業(yè)領(lǐng)域知識(shí)“保證”的,而不能指望數(shù)據(jù)分析算法能“保證”。
工業(yè)界經(jīng)常遇到的問(wèn)題是:數(shù)據(jù)常常來(lái)自某個(gè)“工作點(diǎn)”附近,數(shù)據(jù)量大而相似度高、干擾相對(duì)強(qiáng)而信息含量相對(duì)低。這種現(xiàn)象會(huì)使得分析結(jié)果的可靠度降低。筆者認(rèn)為,解決這個(gè)問(wèn)題,可以把生產(chǎn)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)結(jié)合起來(lái),把“大數(shù)據(jù)”與“小數(shù)據(jù)”結(jié)合起來(lái),而不是局限于生產(chǎn)數(shù)據(jù)本身。
來(lái)源:互聯(lián)網(wǎng)
提交
派拓網(wǎng)絡(luò)被Forrester評(píng)為XDR領(lǐng)域領(lǐng)導(dǎo)者
智能工控,存儲(chǔ)強(qiáng)基 | ??低晭?lái)精彩主題演講
展會(huì)|Lubeworks路博流體供料系統(tǒng)精彩亮相AMTS展會(huì)
中國(guó)聯(lián)通首個(gè)量子通信產(chǎn)品“量子密信”亮相!
國(guó)家重大裝備企業(yè)齊聚高交會(huì) 中國(guó)科技第一展11月深圳舉行