要找到多個變數與多結果之間的關係,有什麼高效的實驗方法?

為了儘可能簡單直觀的描述清楚我的問題,用種蘋果來舉例。( ? ?ω?? )?

假設會影響蘋果樹成長的參數有:

1. 土壤質量

2. 澆水量

3. 施肥量

4. 光照時長

5. 溫度

假設上述參數會對以下結果造成影響:

1. 果實數量

2. 果實顏色

3. 果實甜度

4. 果實形狀

(我生物差,這些都是我瞎說的。)

這裡要注意一下,有的條件可能不止影響一種結果,也有的結果可能不止被一個條件所影響。

果農我現在為了以後的生產便利,想做實驗研究清楚這些變數與結果們之間的關係。

目的是為了在滿足形狀較圓,顏色較紅和味道較甜的條件下,種出最多的蘋果。

(這些臨界的判斷條件也需要得到前期的實驗數據後再定。)

能少試種一些樹當然最好啦。那麼,果農我該怎麼設計實驗才比較高效呢?

(嗯…其實我的真實目的是想通過實驗為一個激光刻PCB的生產流程提供校準方案…但是你們真的當我是果農就好了。)

還請各路理工少俠施以援手。


---------2015年8月15日---------

畢業設計已經做完啦,前天交掉了Thesis,現在來回答一下自己在兩個多月前開始做畢設的時候提出的問題,跟大家分享分享經驗。

其實Arthur Wang先生和朱一先生的回答都很到點子上啦,正交實驗法主成分分析螺旋式收斂,這些都是很重點的。我這裡就主要介紹一個好用的統計學工具,再結合實際和操作說得更具體一點,爭取寫一個比較親民的回答,讓大家應用起來更方便。

首先,要提到一個概念,實驗設計。Design of Experiments(DOE)。沒做畢設的時候不知道,原來DOE這個理念早在1920s就被提出來了,期初是為了應用於農業生產領域,後來又被一個日本的工程師統計學家引入了工程領域。(讓我困惑了一個禮拜的問題其實早就有前人努力的解決啦,果然是思而不學則殆)

實驗設計的方法呢又有很多種,是基於各種統計學和數學原理的,比如說正交實驗法(當因子數量很多時可以大大減少實驗次數),就是基於正交表的一種實驗設計法。

可是我們學工科的,沒有什麼統計學基礎,很難為了做一次實驗去了解那麼多統計學數學的知識。這裡就要介紹一個非常非常厲害的統計學軟體:JMP(我真的不是他們公司來打廣告的OuO)。這個軟體的功能範圍很廣,我也沒都了解過,這裡主要就說說關於DOE部分。給一個官網的介紹鏈接:實驗設計 (DOE)

來一張關於DOE的起始頁截圖:

我的畢業設計大概就是為一個laser cutter的系統優化參數,系統中有一百多個參數。

首先就是像Arthur Wang先生說的那樣,靠經驗來蒙。根據以前的系統使用者的經驗先挑了14個最可能對結果產生影響的參數。接下來用了JMP軟體的「篩選設計」,圖中也有介紹,篩選實驗設計就是為了篩選多個因子以尋找少數最具效應的因子

篩選設計的想法應該是基於pareto法則的,也就是20/80定律,認為20%的原因造成了80%的問題。也就是說在很多的參數中,應該只有為數不多的一些參數,對於整個系統有著十分明顯的影響。在沒有極高要求的情況下,先找到主效應因子,再只針對主效應因子進行優化,應該是非常高效的。

篩選實驗的數學與統計學基礎就是朱一先生提到的正交實驗法了,不過有了JMP軟體,也就不需要我們自己找正交表或者計算正交表了。只要在軟體中輸入被測的因子名稱及其範圍,響應(也就是結果)及其目標,軟體就會根據用戶要求自己計算出對應的正交表,安排好實驗。

---------2015年9月29日---------竟然拖延了一個多月才來把這個回答寫完---------

JMP的好處是,根據軟體安排的實驗計劃執行實驗,再將實驗結果輸入回軟體,軟體會根據使用者要求自行建模分析數據,生成預測曲線。

下圖展示了很簡單的預測預測曲線,Y為一個響應,X1~X3為三個因子,從圖中可以看出X1和X3具有主要影響,而X3幾乎沒有影響。

另外,JMP還可以自動提供和針對各個因子的Pareto圖(可以反應各個因子對整個系統的影響大小),下圖為一個簡單的例子。

根據預測曲線和Pareto圖我們就可以對因子進行篩選,選出極少數具有最大影響的因子,參與後期的優化實驗。

篩選實驗結束後,進行優化實驗。回到JMP的起始頁。實驗設計的方法其實多種多樣,有些注重於篩選因子,有些注重於優化因子。在優化實驗中,自然是要選擇注重優化因子的設計方式,比如說下圖中的響應曲面設計。

同樣,實驗計劃可以由軟體做出,只需按照生成的計劃操作即可。將實驗數據輸入軟體,可以由軟體建模後生成預測曲線。

給一個圖例,我懶得做一個抽象的出來…,就直接複製了自己論文里的圖。

大家不要管裡面的變數具體是什麼,左邊是響應(除了最下面一行),下邊是三個因子。紅色的游標是可以移動的,也就是說可以自行設定因子的值,看其對結果們產生的影響,從而找到符合要求的因子設置。所以叫預測曲線。

總結,嚴格的來說,對於一個複雜的系統,即使有了實驗設計法和JMP軟體的幫助,因子的最優化還是需要經過大量的嚴謹實驗。但是如果目標是優化而非最優化,使用這樣的方法則可以大大的減小工作量,提高效率。

**而且,如果只追求結果,不強調過程的嚴謹性,在實驗進行到後期的時候,可能,不用全部按計劃做完,在過程中,滿足要求的結果就碰巧地出現啦!(概率不小哦 )

-------------------------------------------------------------------------------

未經許可,禁止任何形式轉載。(我知道沒人會轉,我就是想爽一下)

終於寫完了,感覺水水的,畢竟我也是非統計專業出身,對這個東西的了解僅來源於兩個多月的畢業設計,有錯請指正。

因為網上有一些已經很不錯的教材,介紹基於JMP的實驗設計方法,而且,我懶,所以有的內容寫得可能還是不是很具體。如果某個看到的朋友確實有需求的話,又有沒弄明白的,就發私信問我吧。

還有,我自己之前找到了一份很不錯的實驗設計教材(基於JMP的),有需要的朋友可以私信和我要的。


很有意思的問題,工程上,對於這種不確定的問題,就一個字 「蒙」

這個「蒙」是工程經驗的一種體現,它需要你對相關領域有所了解,從而在大方向和實際操作中少犯些錯誤,這個其實也就是資深工程師的價值體現。

蒙需要你要做大量的實驗來獲得新的輸入,從而螺旋式的收斂問題。一步到位是不現實的。思考太多也是滿足不了項目需求的,在嚴謹的推斷的同時,也要合理的猜想,關鍵是要不停地推進問題,而不是停留在口頭上討論和糾結。

最終,項目可能被你蒙出來,你再回頭看,哦,原來可以找到這樣的理論支持,從而再慢慢的增強其魯棒性。

學而不思則惘,思而不學則殆。 既要嚴密思考也要積極實驗。


實驗設計:正交試驗法。

實驗數據分析:典型相關分析,主成分分析。


推薦閱讀:

講解verilog的經典書有哪些呢?
請問各位前輩,Vivado(2016.2)的幫助文檔中,哪些最有利於Vivado初學者的學習?
硅通孔技術TSV有多大的前景,目前有哪些公司或者機構在研究?
微電子設計方向有哪些課程?

TAG:應用數學 | 數學建模 | 微電子 | PCB | 激光切割 |