物理實驗誤差測量中的不確定度是指什麼？數據表示應該怎麼寫？

01-25

首先，對於什麼標準偏差還有各種偏差的計算公式完全不了解。另外，什麼是不確定度？數據表示的時候到底應該怎麼寫？測量數據的平均值加上「+-號」再加上不確定度還是什麼？
請問，這些東西都應該是在什麼課程里詳細學習的？完全不知他們所為何物，求指點。有什麼教材清晰地講解他們嘛？

能問這個問題說明物理實驗課沒有白上～鼓掌撒花！你的實驗報告絕對是打動人心的！

第一次認真的回答問題，如有講的不明白的、錯誤和胡話請指出！非常感謝！

回答問題之前先繞個彎子。

竊以為誤差的處理是實驗，不僅是物理實驗，的真正重點所在。在花了大量的心血和勞動（搬磚搬磚搬磚。。。）以後得到了實驗數據，但是實驗數據意味這什麼呢？我能夠從中得出什麼結論？這個結論是否可信？如何來定量的描述它們？

打個比方說測體重。減肥一個月了，自己到底輕了多少呢？一過秤，發現少了2斤，不錯，很開心。但是如果你是做實驗物理的，一個幽幽的聲音會在腦子裡告訴你：你有63%的概率掉了0～4斤肉！如果你是一個樂觀的實驗物理工作者，那個聲音會告訴你：你減重多達2斤的可信度是50%！（喂。。。這個人做實驗已經做瘋了。。。當然數字都是隨便寫的啦～領悟一下思想就可以了～）

好了，下面回到題主的問題。在講解各種具體的公式和表達之前，首先要對基本的概念有所了解。

什麼是不確定度？

不確定度就是一個實驗測量量不確定的程度。（這不是跟沒說一樣嗎！）實驗數據得到的過程往往是非常複雜的。而在最終的paper/實驗報告上所展示的只能是簡潔的最終結果。那麼如何體現實驗的具體過程對結果的影響呢？甚至於理論對於實驗結果的影響？我們需要一個度量來表徵測量值的可信度，或者不確定度，它擔負著表達整體實驗過程和實驗員人品（這是什麼鬼。。）的重任。一個孤零零的數值甚至可以說是毫無意義的，就像彩票中了500萬的人不能想當然的以為下一次還會中一樣。

舉個栗子：

小李來實驗室的路上看到有剛出鍋的糖炒栗子，於是買了2斤。到了實驗室覺得不對，掂著沒有2斤啊！本著天生的物理素養，他決定用實驗的方法來驗證他的猜想。（在實驗室吃栗子還有什麼素養。。。）

首先，他搬來一個電子天平，用標準砝碼較一下准，然後栗子放上去一稱，0.875kg，果然輕了！他看了一眼天平的感量和說明書上給出的誤差，嗯，不確定度最多+-0.001kg，肯定是輕了！

這時候天邊來了一條閃電划過他的腦洞：還有空氣的浮力！所以有可能實際上質量是1kg沒錯。怎麼辦呢？用動力學法來測吧！於是他搭了一套滑輪，找出剛才那個標準砝碼，光電門，計時器，折騰了一天，測出來質量為0.86kg，不確定度為+-0.02kg。難不成做實驗的時候栗子被人偷吃了？小李陷入了沉思。。。

我們來正經的分析一下這個小李的實驗和實驗結果。

首先澄清一件事情，我們假設小李只是腦洞大了一些，實驗操作和數據處理是沒有任何問題的。可以看到，直接的測量給出的結果比間接（動力學法）不確定度要小很多。因為複雜的實驗在過程之中會引入各種各樣的不確定度，比如滑輪有沒有摩擦呀？繩子的質量有沒有被計入啊？等等。所以給出的不確定度就會很大。在科研中，比如測量higgs栗子，錯了，粒子的質量，可以通過不同的衰變道和衰變產物來測量，有一些很簡單只要測量10個末態粒子；有一些衰變過程很複雜，需要測量100個末態粒子的參數（數字都是打比方）。那麼後一種的實驗不確定度自然會比第一種方法要大。所以一個負責人的實驗物理學家會給出盡量準確（注意不是盡量小，而是盡量正確！）的不確定度估計，來表徵他這個實驗的整體。當然了，一個自信的實驗員相信自己的技術，可能給出的不確定度偏小，一個保守的人就可能偏大。這種主觀性在複雜的實驗中是不可避免的。所以說，不確定度還和實驗員的人品有關（與之相關的，更加深入的還可以看一看關於貝葉斯統計和先驗概率的知識）。當然啦，如果為了發paper，給出的不確定度估計過於激進，自然會被同行打臉的。

好，那麼現在了解了什麼是不確定度和它的作用，我們來看它是如何完成這一使命的。

這裡先做一個簡單的說明，具體的可以參看段家祈《普通物理實驗》的誤差分析一章，或者任何一本概率統計的書。

我們知道，在實驗中是存在很多的隨機性的。這些隨機性具體表現出來就是在多次測量同一個物理量的時候可能得出不同的結果，並且這些結果會呈現出一定的概率分布。而由於小李的精力和生命長度的限制，實驗不可能無限的重複下去，消除漲落得到真實值。所以我們就要做一定的假設，來表徵測量量可能的概率分布。比如說最常提到的高斯分布，這是由大數定律所保證的。或者說在數據量較少時使用泊松分布來進行估計，（直觀來講，比如質量這種量總不能是負的，而一個方差與均值相近的概率分布就會有很大的出現負值的概率，這時候很明顯高斯分布的估計就是錯誤的了。這時候，一個看上去正確的不確定度估計可能會是2+3/-1kg）。

在有了這個分布的估計後，就需要找到一種方法來表達它。這裡就涉及一個置信區間的問題。

置信區間是指測量值具有一定的概率落到這個區間之內。比如對於高斯分布，使用正負1sigma來表示63%的置信概率。而當分布不是高斯的時候，為了一致性，通常也採用63%這一概率來給出置信區間。這時候就有可能會看到正負不一致的不確定度估計。

現在就有兩個問題了：

首先，概率分布僅僅是一個猜測，從數據中如何得到？和真實情況之間的差別怎麼辦？其次，置信區間意味著什麼？如何通過給出的區間估計和數據值分析得出結論？

首先來回答第一個問題。

數據永遠不會無限的獲得，通過數據的分布來估計測量量的概率分布永遠會有一定的誤差。而且一般情況線沒有條件來獲得足夠多的實驗數據進行分布的估計。這時候有兩種辦法來解決：第一，做模擬，第二，選取合適的統計量。做模擬這個很好理解，通過計算機模擬來獲得大量的實驗數據並研究其分布特性，然後根據這個分布對真實實驗值的不確定度，或者說置信區間進行估計。具體細節非常冗雜了，我也說不太清楚。

選擇合適的統計量是更加有效和必須的方法。在實驗中，很少有單一的測量。一般來講實驗結果由多個測量量，或者說多個隨機變數來決定。除了普物實驗中涉及到的誤差傳遞的知識，更加科學和系統的方法是定義統計量。定義一個新的量，是所有測量量的函數，由於一定的統計特性，使得其滿足特定的分布。比如說，n個滿足N(mean,sigma)的獨立隨機變數X1,X2...Xn的平均值滿足N(mean,sigma/n)的分布（註：N(mean,sigma)表示期望為mean,方差為sigma的高斯分布）。但是sigma的值我們只能給出估計值，即方差，而不能給出真實值。在數據量比較小的時候，我們就會計算標準偏差

，它作為統計量的好處在於其滿足自由度為n-1的t分布，與隨機變數本身的方差、均值等無關，在n很大的時候，就會趨於高斯分布。然後根據這個統計量來給出區間估計就相當準確了。這就是為什麼書上出現了很多奇怪的公式。。。他們都是為了給出合理的統計量並給出正確的區間估計。這也是題主所問的問題。前面說道的實驗員主觀的估計，會被吸收到統計量的構造之中。可以這樣理解，任何一個誤差來源都對應一個測量值以外的隨機變數，就是統計量的一個新的參數，就會使得統計量發生變化。

下面就是第二個問題，我們定義了如此醜陋的統計量，有可能一點物理意義都沒有，那麼我們是怎麼得出結論的呢？

是這樣的，真正的實驗都是在做一件叫做假設檢驗的事情，（我自己的理解也不是很深刻，詳情參見任何一本概率統計教材）。在實驗時，我們有一個理論，做出了一個假設，然後根據實驗數據來驗證這個假設，然後給出一個區間，如果實驗數據在這個區間之內，我們就有一定的概率否定假設。拿最簡單的長度測量來說，我們的實驗結果是：「一個長度真值是在10+-0.1cm之間一個值x」的假設以63%的概率不被否定（@_@報告，觀眾在這裡已經暈了。。。沒關係，看不懂就還按照「真值落在10+-0.1cm這個區間的概率是63%」來理解吧。。。沒有什麼太大的問題）。對於簡單的實驗，這一套理解似乎非常拗口。但是對於複雜的分析，就相當有用了。比如說，我們要尋找一個新的栗子，粒子，實驗有了數據，那麼結論到底是有還是沒有呢？我們會說：這種新粒子的強度90%的置信區間為小於XX。即新粒子強度大於XX的假設都被以大於90%的置信概率否定掉了。

換句簡單的話來講，在複雜的實驗中，最重要的是給出正確的置信區間估計，這個區間才真正聯繫著最終的物理結論。

講了這麼多，就是希望看到的人能對實驗誤差的重要性有一個新的認識，能夠真正理解做實驗的人是在做什麼，為什麼實驗結果就是有說服力的，另外也能夠有更大的動力去認真的完成一篇合格的精悍的實驗報告。

如果可能的話可以去看一看概率統計和實驗數據處理方面的書，會有一些大體的了解。而想要真正的理解實驗中的誤差處理恐怕需要一段的時間和工作經歷。

================================

5.4更新

有人問如何剔除壞點=。= 好問題，但是抱歉目前我也沒有做過這方面很深入的工作，所以就自己所能講一講，歡迎深入討論！

說白一點，這個問題就要看你的專業素養了。什麼樣的點需要被去除，什麼樣的點需要保留，要制定一個規則么？如果點恰巧落在規則的邊界上怎麼辦呢？如果如何判斷壞點的去除是否左右實驗結論呢？這個問題實際上是在做數據分析中佔用時間最大的一部分工作。而不可避免的是引入主觀的判斷。所以說，要本著科學的態度，嗯，科學的態度來做這件事情。

首先從最簡單的普物實驗說起。

普物實驗經常做的就是對一系列數據進行擬合，求出參數，然後把結果跟標準值對比。然後發現：去掉最後一個點擬合結果就更好了呢！跟標準值更接近了呢！好，那就這樣做吧！

上面的做法最嚴重的問題在於：對於數據的調整是在結果計算出來之後！

調整就變成了主觀的，根據結果的調整。而如果去掉最後一個點使得結果與標準值的差距更大了，這時候你還會去掉么？所以一定要根據一定的規則來選擇數據。比如單個數據的測量誤差、數據是否滿足理論上的統計分布、比如測量數據時的儀器狀態、比如數據的某個特定性質等等。

栗子君又回來了～

某P大每學期都末要進行教師評價，學生們在不同的指標上給老師打分，1～10分，然後計算總分，作為老師的業績評價之一。一般老師看到評價結果該改正的改正，該忽略的忽略，但是輪到做數據處理的老師就有意見了...（不是因為給他分低...）他看到的評價報告是這樣的：

---------------------分數：|__0__|__1__|__2__|__3__|__4__|__5__|__6__|__7__|__8__|__9__|_10__|

--------課堂內容豐富，|__0__|__0__|__4__|__8__|__10_|__ 58_|__21_|_43_|__65_|__50__|_35__|

--------------課後指導， |__0__|__0__|__0__|__0__|__5__|__49_|__10_|__28_|__77_|_89__|__55_|

。。。

數字表示給某一分數的學生人數。比如「課後指導」一項給10分的有55人。

咱不糾結具體的項目和平均分，學生人數等等等。老師火眼晶晶一下就看出了問題：為什麼給5分的人這麼多！明顯不符合統計分布！這是我中大獎了么！栗子君說打分系統默認是5分，我沒改直接提交了（笑），然後被老師吃掉了。。。心情平復以後，老師大概估計了一下，有40+/-5位學生沒有填寫而直接提交了默認值。

這些學生明顯是數據上的壞點了。可以剔除。但是問題是萬一真有人認認真真的選了5分呢？所以更好的做法是：1）結合所有項目，將所有項目都是5分的問卷剔除。2）並在下一次設計問卷系統時加入計時功能，記錄學生填寫評價所用時間，小於1分鐘者剔除。3）不再求平均分，而是根據大樣本的統計求出0,1,2,3,4,6,7,8,9,10分數的統計分布，然後根據分布擬合得到評價分數。

這三種改進方法分別依據：1）數據是否是小概率出現的。2）數據的某個表徵其性質或儀器工作狀態的特徵值。3）根據統計分布，不具體剔除數據而是將數據作為整體進行修正。

簡單的實驗中一般都會根據1）來挑選數據。為了判斷是否為小概率事件，最好的辦法就是每個點重複測量多次。或者系列數據多增加採樣點並適當對測量範圍進行延伸。因為有時候並不是數據不對，而是超出了擬合公式的適用範圍，這時候應當看到系統性的偏離，並且可以根據這個偏離確定理論的適用範圍並選取合適的擬合區間。

對於複雜的實驗，比如說高能實驗，數據的篩選或者叫觸發trigger判選是一個極其複雜的過程。探測器有背景雜訊，要從物理事件中除去。大氣中有宇宙線、土壤、儀器中有放射性，形成本底事例，要從物理事件中除去。高能粒子使得探測器信號益處，能量測量不再準確，要去掉。兩個粒子同時擊中探測器形成偶然符合，要修正或者去掉。等等等等等等。。。。。

工作中會定cut，每一個cut負責對數據的一個性質進行篩選。有物理的和非物理的cut。在確定cut前整個工作組要開多次會議，cut結果要通過模擬和實驗檢驗。要保證cut的科學性和探測器效率（去掉的事例太多就要積累更長時間才能得到同樣多的數據量，而高能實驗的運行又是燒錢運動）並且要準確的計算cut的通過率，用在後續的分析中。

為了避免cut的主觀影響，實驗組還會制定一小撮人做blinding，大意就是將數據進行一定的變換，使得他們不知道自己處理的數據的物理含義，然後按照統計進行數據處理。這部分我也不太清楚，還沒有具體遇到過。

最後，如果不會做數據的篩選，沒關係，看看近些年物理學家們是怎麼對付這個問題的（Ref: Review of Particle Physics, Particle Data Group. Chinese Physics C, Vol 38, 9, 2014）

「A brief history of early Particle Data Group averages is given in Ref. 3. Figure 2 shows some histories of our values of a few particle properties. Sometimes large changes occur. These usually reflect the introduction of significant new data or the discarding of older data. Older data are discarded in favor of newer data when it is felt that the newer data have smaller systematic errors, or have more checks on systematic errors, or have made corrections unknown at the time of the older experiments, or simply have much smaller errors. Sometimes, the scale factor becomes large near the time at which a large jump takes place, reflecting the uncertainty introduced by the new and inconsistent data. By and large, however, a full scan of our history plots shows a dull progression toward greater precision at central values quite consistent with the first data points shown.」

有沒有覺得搞高能這幫人和寫實驗報告的沒有區別(=(工)=)

你的結果是多少啊？咱倆湊成一樣的吧~

5.4更新結束

================================

最後來推薦幾本書好了：

段家忯《普通物理實驗》這本書前面有一些基礎的講解，提到了關於誤差的基本概念和處理方法，包括如何進行簡單的誤差合成與傳遞，如何進行最小二乘法擬合，如何進行假設檢驗等等。

在了解了基本概念以後可以看一些概率與統計的書。了解一下關於假設檢驗的內容。

如果對這個問題非常感興趣，或者想在專業方向上深入了解，可以看Glen Cowan, Statistical Data Analysis. 裡面詳盡的講解了物理科研中遇到的各種實驗數據處理問題。內容稍微側重於高能物理實驗方面，因為高能實驗過於複雜，數據量巨大，想要得到令人信服的結論必須動用適當的統計方法。另外還有一本非常好的書，Data analysis in high energy physics : a practical guide to statistical methods, 這本書中講解了高能實驗中實際會遇到的各種問題和處理方法。作者是ROOT的開發者之一。專業內的同學可以來看一看。

附：ROOT是竊以為非常方便的一個數據儲存、分析處理、做圖的程序庫。裡面封裝了大量非常好用的數據類。做出的圖也比excel要專業很多啦，還可以畫費曼圖什麼的。ROOT | A Data Analysis Framework

而且跨平台、文檔幫助齊全容易上手，專業函數絕對齊全。比如可以做蒙特卡洛，神經網路分析等等。當然，這個是CERN開發的，所以服務對象主要是做高能的人。

這個問題涉及到很多的數學公式，無法全面的做講解，所以只是簡單介紹一下幾個知識點，希望有所幫助。

1.測量不確定度是指由於測量誤差的存在而對被測量值不能肯定的程度。

表示形式：x=「測量的平均值」+-「u(p)」，其中u為測量不確定度，p為包含真值的概率。表示真值在落在（平均值-u，平均值+u）之中的概率為p.

2.不確定度又分為A類不確定度和B類不確定度，最終的不確定度由兩者合成。A類不確定度可以用概率統計的方法來評定。B類不確定度評定是用來評定測量範圍內無法按照統計規律做評定的不確定度。

3.殘差：各測量值與平均值之間的差值。

方差：一組數值的殘差的平方之和，除以（n-1），n為數據個數

隨機變數的標準誤差（又稱根方差）：方差的平方根。

平均值的標準誤差：用隨機變數的標準誤差除以（根號下n，n同上。）

這些知識點都是物理實驗數據處理中的基本問題，並且不確定度的計算不只涉及到這幾個。因為公式沒法表示，又沒辦法用語言描述，所以只能推薦去看書。在大學物理實驗的基礎教材中應該可以找到。

剔除「不良數據」似乎可以參考下Chauvenet"s Criterion.

Prob(outside t(sus).sigema ) 中的sigema 就是高斯分布中的標準偏差，這個概率Prob(outside t(sus).sigema )因此也是根據高斯分布得出的。

行業內混吃的路過，不確定度簡單說就是分析人機料法環對實驗結果的影響程度，構建個小模型，以判定該實驗系統對實驗結果的影響。也就是說針對性很強，只要改變一個參考條件都會影響到結果，同樣的實驗器材在不同的環境下也不盡相同。所以，大部分的教材來說，即使看書也是看概念，不同實驗的不確定度計算方法和參數也不一樣，外行也很難給出標準統一答案，題主可以搜索：測量不確定度，實驗誤差原理，實驗數據處理這一類的書，基本上能了解全貌，但是實用上更多還是自己按照這個方法摸索。

不確定度表徵測量不能被肯定的程度，用一個數值來表示，該值一般取實驗標準偏差或其整數倍，表示測量值落在該數值界定的區間內的概率。不確定度是測量存在誤差的體現，是對誤差的一種規定的定量描述。大學物理實驗關於數據處理的綜述部分都會有不確定度理論的介紹。最好的參考資料是國家技術標準，不確定度指南。