如何流程挖掘/模擬?

希望大家能分享可靠的流程分析工具教程。


自問自答,這是我的筆記。雖然做到了基本的很小白的東西,但還有很多問題還沒解決。還望能幫到大家,還有一起解答問題。

-----------------------------分割線----------------------------

工具:

必須:

ProM 5.2(6.3功能不明,暫不使用)

CPN Tools

ProM import framework(簡稱PIF)

可選:

YAWL(設計時用)

YAWL模擬工具架構上分為3個部分,分別是YAWL,ProM和CPN Tools.

YAWL用於設計、定義流程模型和組織模型,和記錄工作流引擎目前狀態;

ProM把yawl net翻譯成petri net,並使用歷史數據或者模擬數據進行流程挖掘、分析。

CPN Tools導入CPN並進行模擬,生成模擬記錄。

模擬過程總體來說是以下幾步:

1. 準備好流程模型、組織模型

2. 使用ProM的Merge Simulation Models把前兩者合併,並轉化為HLpetrinet

3. 使用ProM的Export to CPN Tools 2.0將HLpetrinet轉化成CPN,並設置各模擬參數

4. 使用CPN Tools打開CPN文件,設定case數,跑模擬

5. 使用PIF把模擬記錄轉換成mxml文件,使用ProM打開並做分析挖掘。

6. 調整模型

下面是具體流程

1. 準備流程模型和組織模型。

注意兩者擴展名都是xml.不是導出時的。 yawl specification可以直接改擴展名,載入時選擇 newYAWLfile載入就可以,組織模型還沒明白。

2. 將兩者載入到ProM里,選擇analysis中的Merge Simulation Models,調整參數後生成Merge net。

3. 選擇Conversion中的HLyawlnet to HLpetrinet,生成

(重點) 4. 選擇Analysis中的Export to CPN Tools 2.0,調整好參數,保存。

暫時還不知道其他選項用處,最好全部勾上。

不要勾選有waiting time的,載入到CPN Tools時有錯誤,似乎是HLyawlnet轉成HLpetrinet過程中會生成新的弧,那些弧缺乏定義。

Edit Process Detail中有case的分布選擇,這次模擬選擇了伯努利分布。請按需調整

4. 使用CPN Tools打開生成的cpn文件,等待syntax check,可能需要數分鐘。在檢查通過(文件名下劃線變成綠色其他全部消失)之前,無法做模擬。

*註:關於CPN tools的syntax check可以參考 (Syntax checking &<&< CPN Tools Homepage),當檢查不通過時需要調整export時的參數或者手動調整CPN。

5. 打開simulation面板,選擇一種模擬工具進行模擬。

可以調整模擬完結條件,只有控制step(變遷數)和time(案例數)兩種的上限數量。

6. 模擬完畢後,用PIF設置好導入目錄和輸出目錄,將cpn的日誌文件轉化為mxml文件。

7. 把mxml文件導入到ProM中,就能愉快地做下一步分析了。

---------------------------

餘下的問題:

1. 官方教程提到將模型、組織模型、日誌文件3者合併在一起再轉化,事實上只用前2個。到底是怎樣?

2. ProM不能載入ybkp文件,那麼組織模型那個格式是怎麼來的?

3. 轉成HLpetrinet後,似乎丟失了一些弧的信息,使得CPN不能進行帶waiting time的模擬。該怎麼處理?


那數據挖掘和是spark可以結合在一起嗎


你好!我有問題需要問你:在CPNTools中不能新建一個流程,然後給活動的執行按照不同角色執行的比例進行自動生成流程執行日誌嗎?我看有一篇論文是這樣做的實驗?所以想問問你可以這樣做嗎?或者能不能麻煩你把你的這兩個文件讓我參考一下呢?我不知道這個模型你使用什麼生成的?急急急,希望得到你的幫助


推薦閱讀:

Deep Matrix factorization Models for Recommender System
2017摩拜杯演算法挑戰賽 第三名團隊解決方案
誰來用最通俗易懂的語言跟我講一下k平均演算法(k means clustering)??
R實戰案例:利用演算法識別糖尿病患者(R語言實現)
紅包都送不出去了?教你看懂數據,不再懷疑人生

TAG:數據挖掘 | 流程 |