為什麼石油勘探需要高性能計算機?

11-29

近日，我們從國外媒體報道得知，隨著世界第一的高性能計算中心的新址曝光，世界上最大的商業研究超級計算機也隨之展現在我們的眼前。該設備配置了10,864顆英特爾英特爾至強處理器，共計5432個節點，96992個內核，預計能交付每秒2.2千萬億次浮點計算能力。這座坐落在英國石油公司休斯頓地區，佔地約110,000平方英尺的高性能計算中心，隸屬世界上最大的石油和石化集團公司之一英國石油公司 (BP)所有。

為什麼石油勘探需要高性能計算機？一句話回答就是：石油勘探的數據量和計算規模要求它必須用高性能計算機。
簡單的說，石油勘探面對的數學問題就是Ax=b。b是野外採集到的數據，規模通常是幾百GB到幾十TB之間；x是地下結構模型，最簡單的情況是僅考慮縱波速度，如果是一個20kmx20km的工區，深度為10km，為了使反演的地下結構達到足夠的精度，模型的網格不能太大，比如50mx50mx20m,這個模型就有80,000,000個網格，或者說8千萬個需要求解的未知數。A:經過精細的信號處理，可以近似得到A。20kmX20km的工區，石油勘探要做的是解一個有8千萬個未知數的方程,而且是病態欠定非線性方程。
實際上，石油勘探的工區通常遠遠大於20kmX20km，地下結構模型也並不是只包括縱波速度，同時野外採集到的幾百GB～幾十TB的數據也需要進行複雜繁瑣的信號處理以提高信號質量。
從計算時間上來說，即使僅僅考慮勘探數據處理工作中的最後一步：偏移。直到本世紀初，工業界才開始在日常的數據處理工作中引入深度偏移，就是因為從那時開始高性能並行計算機才可以處理這樣大規模的問題，也僅僅是能夠處理而已；因為一次偏移通常需要幾天到幾周，甚至幾個月（這應該是上世紀末的水平）。即使是今天，做一次20kmX20kmX10km這個規模的工區的簡單偏移，使用cluster，幾百個節點，每個節點上有16個64位的CPU，一次偏移也需要十個小時左右的滿負荷運算。而且通常情況下，速度模型需要迭代求解，所以一個項目可能需要多次偏移。
高性能並行計算是這個行業的基本要求，如果你到國內的石油勘探相關單位去參觀，他不可能沒有幾百幾千個節點的並行計算機。題主提到的BP擁有的五千多個節點的機群，其實並不多。BP是油公司，通常它對計算的要求並不是特別高；石油服務公司（比如Schlumberger/WesternGeco或CGG）才是並行計算機的大客戶。
我現在公司據說是Houston的電力消耗No1，就是因為整整一棟樓的cluster需要24X365不中斷的運行。

數據量大從高性能計算機就可以簡單推斷的… 非專業人士，主要簡單感性描述下到底處理些個什麼複雜玩意：

在數千平方公里的地面上，按 4 km 或 8 km 或其他大小的間距/網格人工製造地震，然後在地面拾取到地下反射回來的地震波。

地層厚度不同、硬度不同，同一個震源出來的地震波被你不知道多少次的反射折射，最後回到地面都被檢波器收集起來。

然後為了儘可能真實還原看不見摸不著的地下的構造，比如地層起伏、斷層分布，就需要對這一堆亂七八糟的數據做處理，提高信噪比(即增加有用信息、剔除干擾信息)，以不同方式還原出儘可能清晰且「合理」的圖像。數據大小其他答案已有列舉。GB甚至TB級別。不只是大小，更是複雜程度。

從地震波數據處理出來的就是這黑白道，好多人就在那比比劃劃說這是什麼層那是什麼層… 默默溜出會議室…

二維結果就是一刀切的一個面；三維就是一個體，通常做已有井後的精細化勘探。

沒見過的東西千人千解，所以處理人員對此區域的構造情況的了解和理解也是非常重要的。所以勘探風險大吶，沒打口幾百萬上千萬的井，永遠不知道地下到底是什麼樣。

贊同第一名的答案，另外再補充一點：
石油大佬們才付得起高性能計算機的報價呀。
你看窮IT民工們只好搞分散式計算以解決運算性能問題。

我本身就是學地球物理的，對石油勘探了解一些。ls的geovector朋友已經解釋的很清楚了，我就不班門弄斧了。我只想告訴lz，大型計算機和超快計算機的設計目的是為了進行巨大規模的矩陣計算和超大容量的數據計算。所以這樣的計算機一般都用在模擬地球。主要用在大氣和地下結構的研究中。而石油勘探僅僅是一個方面，地球物理中做深部結構的研究人員對這種計算機也是很渴求的。

你是不是以為勘探石油就是插根管子進去，沒出油就換個地方插

關鍵是人家公司有錢！！天氣預報，氣候變遷，地震預測，甚至大型加速器的數據處理，那個不需要高性能計算機，但是買不起啊。。。

《走近科學》 20121029 超級計算機
這期節目講了講超算在物探中的應用

大規模矩陣運算吧

作為一個搞地球探測的工作者，高性能的計算機簡直就是給我們插上了翅膀

不只是石油勘探，現在大部分工程技術都要從經驗科學發展為計算科學，也就是大量的定性問題要轉化為定量問題，其中大部分問題，都可以歸納為解微分方程，迭代（積分），矩陣計算等數學運算，例如最簡單的，如樓上的線性方程組Ax=B，當需要計算的單元足夠多時，此線性方程組的解是巨大的。再比如，大多數情況下，線性解的精度並不能滿足工程上的需求（例如Euler forward），需要更高精度的方法和演算法（例如RK，4階），這對計算機的性能提出了更高的要求，所以對於現代工程來講，計算性能是遠遠不夠用的。

例子：CFD, FEM, MD等

拿MD，分子動力學來說，一摩爾的物質的量是6.022^23這麼多，大多數固體或者液體，大概一立方厘米這麼大的體積有10^23這個數量級的原子個數，即使世界上最先進的超級計算機天河，也最多能夠滿足10^10-10^13個原子這麼多的計算，但是在物質中，一個原子所受到其他原子的影響，是大於10^23這個數量級的。

回答完畢，有錯請糾正。

在大規模運算領域裡一個見得到實實在在的金錢利益回報的地方而已。

數據量太大了，一個石油，一個氣象，直接推動超級計算機的發展