數據收集篇之七:測不準的幾種情形
在量子力學中,有個著名的測不準原理。講的是微觀客體的任何一對互為共軛的物理量,如坐標和動量,都不可能同時具有確定值,即不可能對它們的測量結果同時作出準確預言。這是德國物理學家沃納·卡爾·海森堡於1927年提出來的。
茅於軾先生在描述測不準原理的啟示時說:「測不準原理是說,你不可能客觀地觀察一個事物,看清它的原來面貌。任何測量都是一個相互的作用。所以當你觀察它的時候,由於觀察對它的影響,他已經不是原來的樣子了。」
另一種測不準的情況,二十世紀六十年代,法國數學家曼德勃羅提出這樣一個問題:「英國海岸線到底有多長?」。他發現測量的尺度(精度)不同,測出來的長度也不同。這是由於海岸線是由不規則的曲線組成的。測量尺度越大,就會不斷忽略那些較小的曲線;測量尺度越小,越小的曲線就會被測量出來。曼德勃羅對此進行了深入研究,從而開創了一種新的幾何學——分形幾何學。
分形幾何學很有意思,通過不斷地迭代、分形,可以讓我們窺探到大自然的奧秘,正可謂一花一世界,一葉一菩提。
當然對於工業和商業上的日常測量來說,基本上沒有能夠測得準的情況,主要原因在於真值的未知。如測出的一公升水不一定真的是一升,多點少點都有可能。有些測量用標準件做真值,如測長度時用有明確標稱值的塊規,每天先用量儀量一下塊規,如果與標稱值有差,則要校準一下;測重量時用砝碼,小時候在我家對門就放著很多砝碼,有5Kg、10Kg、20Kg等等,把砝碼放到磅秤上就可以進行校準。但塊規和砝碼也不一定準,用著用著也會因磨損等原因發生變化,所以定期的檢定和校準是非常必要的。
關於檢定和校準,國家和各個行業都制定了很多標準,這裡不再展開。
在關於測量的教科書中通常將真值分為三種:
理論真值:一個有嚴格定義的理論值的量,如三角形內角和為180°;
約定真值:是一個接近真值的值,有的來自國際或國家的基準,有些來自國際權威組織的推薦值,有時也採用在沒有系統誤差條件下多次測量的平均值;
相對真值:通常將高級別儀錶測量值作為真值。等級的劃分在國家標準中都有明確的定義,在儀錶檢定時常用的方法通常也是拿高一級的儀錶來檢定低一級的儀錶。
對於檢定和校準來說,比較多的採用約定真值和相對真值來提供檢定的標準。
小時候商店裡有散裝酒賣,8角5分錢一斤。我父親經常給我1角7去打二兩酒。商店裡不可能用量杯給你準確地量的,都是用馬口鐵做的酒提子舀出2兩來。舀多舀少全看店員,今天高興了,就給你舀滿一點;要是不高興,舀上來的時候手抖一抖就能少個2、3錢。這樣的量具的準度級別應該是最低的,也要檢定嗎?是的,要檢定。我就親眼看到過市裡來人檢查過,當時那個店員小心翼翼地舀出一提,檢查員拿量杯核對,我看到店員緊張得頭上都冒出汗了。這裡量杯就是比酒提子高級的量具,對於酒提子來說它的結果就是真值,因此可以用量杯來校準酒提子。
當然對於工業和商業上的日常測量來說,並不要求足夠的準確,只要能夠保證足夠的分辨力(測量值有足夠的有效數字)就可以了。以上講的是計量數據的測量,如果是計數數據,是不是也一樣測不準呢?
遺憾的是大多數情況下是的。
有些情況,比如公司里有多少人,各是什麼年齡、什麼學歷等等是可以測準的,但很多情況是測不準的。
我曾經指導過的一個電信公司的項目,是關於電纜線對的準確率的,項目組拿著資料到現場核對,發現準確率只有30%不到,可見在管理系統中是不可能調取到準確數據的。更加麻煩的是,有些線對甚至在現場也無法核對,因為在用的線對你無法將其中斷來進行核對。
在另一個項目中,發現不同的管理系統中,數據差距很大,也就是存在所謂的「信息孤島」現象。這種現象在社會上普遍存在,被人廣為病垢的「我是我」、「我媽是我媽」之類的證明,其背後的原因就是部門之間存在的壁壘,相互之間信息不流通,也是一種官僚的體現。好在國家已經意識到這個問題,正在考慮建立國家統一的數據倉庫,相信未來這類奇葩的證明會逐步消失。
對於計數數據,還有一類數據也基本上測不準。如客服人員的崗位定級,由於定級標準存在模糊地帶,因此在執行上就存在不同的解讀,不同的人就會評出不同的結果。曾經有一個涉及客戶投訴的項目,我當時要求項目組做一個關於投訴分類準確性的測量系統分析,結果總體準確率也只有70%左右,測量系統不合格。
綜上所述,對於計量數據測量來說,定期將量儀送權威部門檢定是保證測量準確性的重要手段,要堅持下去。對於計數的數據測量,定期的測量系統分析必不可少。
請關注我的微信公眾號:張老師漫談六西格瑪
推薦閱讀:
※抽樣分布篇之四:戈塞特和t-分布
※六西格瑪的思維和方法是否適用於互聯網產品的產品質量或者服務質量?
※在讀博士期間考出six sigma有必要嗎?我主攻塑料工程
※為什麼六西格瑪概念的提出會引發技術的革新?