大型望遠鏡觀測到的數據是各國共享的嗎?會因處理方式的差異產生不同的結論嗎?

目前對於大型望遠鏡觀測到的數據是共享的嗎?那因為的處理方式的差異會產生什麼結果?
-----

本題來自知乎圓桌?宇宙那麼大,更多討論歡迎關注。


這個問題略複雜,各個望遠鏡有各個望遠鏡的制度,即有完全共享的也有完全不共享的。所以需要強行分類的話只能按程度劃分以下。因為我比較熟悉光學,所以只談光學望遠鏡。

一、即時的完全共享:很抱歉,目前還沒有能做到這一目標的望遠鏡。不過下一代已經開工建設的大型綜合巡天望遠鏡(LSST)能基本做到。這個神鏡被設計用來對全天不停的進行圖像拍攝。沒記錯的話幾個月就能把可觀測的天空拍攝一遍。一晚上產生30TB數據,經過專門的網路傳到山下的數據中心進行處理。然後世界各地分布著多個數據中心進行同步。

二、通過分批的數據發布(DR)實現的完全共享:很多大型巡天項目都是這個思路。最著名的是斯隆數字巡天(SDSS)。在科學家們商討出下一季的科學目標並設計好觀測的天區後,望遠鏡由專門的人進行觀測並根據天氣制定觀測計劃。然後定期進行數據發布。從2000年左右開始,已經進行了12次數據發布。國內的郭守敬望遠鏡(LAMOST)也是採用類似的思路進行數據發布。

三、刻意延時地進行數據公開。這是多數大型通用型望遠鏡的思路。由於現在大型望遠鏡經常需要社會上各種公益基金會地贊助,基金會經常希望數據能夠得到充分的利用。因此,在這些望遠鏡上取得的觀測數據會經過一段保護期以後進行公開發布。例如著名的Keck望遠鏡、CFHT望遠鏡和歐洲南方天文台的很多望遠鏡都是這樣。世界各地的天文學家可以通過他們的資料庫網站查詢。

四、不進行數據公開。這些望遠鏡通常比較小。屬於一個大學或者幾所大學自己建設、擁有並維護的望遠鏡。

這些數據公開方式也並不是涇渭分明。比如CFHT搞過CFHT Legacy Survey,這個巡天就是分批數據發布式的。現在日本昴星團望遠鏡在做Dark Energy Survey,也是分批數據發布。

另外要提到的是,大型通用型望遠鏡一般都可以由滿足一定條件的世界各地的天文學家申請觀測時間。但根據望遠鏡管理方的政策,滿足不同客觀條件(例如歸屬於哪個國家哪個研究所,這些研究所入股多少)申請到的概率是不同的。

對於第二個問題:是的。數據雖然是死的,但是如何解釋數據是人說了算的。最簡單的,有的人說3sigma就能確定一個天體是不是變源,有的人說得6sigma。最近比較有名的時間是BICEP2。就是一幫人用一個南極的望遠鏡觀測微波背景輻射,說發現了宇宙大爆炸早起引力波的信號,然後Planck一幫人用了不同的處理方法,當然加上其他的數據,最後發現這些信號主要其實是來自銀河系內部星際介質的污染。不過對於很多已經非常常規的數據處理過程,比如做平場、做測光之類的,大家基本方法都是一樣的,可信度就比較高。


大型望遠鏡分為3類,一類是通望遠鏡,一類是專用望遠鏡,一類是巡天望遠鏡。兩種情況有所區別。

第一類

對於通用望遠鏡來說,使用者是全世界的所有天文學家。通常在觀測季之前徵集使用申請,科學委員會對申請進行評估,選出好的研究題目,分配觀測時間。拿到觀測時間的天文學家,就可以按照分配的時間動身去觀測了。

觀測之後,會通過磁碟或網路方式拿到原始數據。這個數據僅僅是申請者本人可以拿到。他進行研究分析之後發表論文可以用這個數據。但是這種限制是有有效期的,時間一到,就必須對外開放這部分數據。不同的望遠鏡可能有效期略有不同,有1年的,有1年半的,有2年的,不一定。

第二類

專用望遠鏡是團隊內部使用的望遠鏡,通常不會對外開放,只是自己人觀測、自己人分析、自己人發布成果。當然,成果發布了,就需要把數據也給出來,交給科學界檢驗你的成果。

第三類

對於巡天望遠鏡來說,使用者是望遠鏡自己的運行團隊。觀測計劃是自己定的,觀測方式是自己定的,數據也是自己拿到自己處理的。之後,團隊會根據自己的條件,選擇對外釋放數據的方式。比如LAMOST巡天望遠鏡是在上一個觀測季結束觀測之後立即向工作組合作者釋放數據,1年之內向國內合作者釋放,1.5年之內向全世界釋放。


一般的望遠鏡都有自己的數據網站,供大家自由搜索、下載。例如:
NRAO(VLA,VLBA,GBT):NRAO Science Data Archive
ALMA:Archive — Welcome to the Science Portal at NRAO
SMA:Obtaining Processing SMA Data
Spitzer:Overview
德令哈13.7米望遠鏡:歡迎來到毫米波射電天文資料庫
以上的數據大多是過了保護期的個人項目的數據。

另外有些巡天項目也有自己的數據分享網站:
HOPS: H2O southern Galactic Plane Survey
CORNISH: VLA survey of the Galactic Plane
The BICEP and Keck Array CMB Experiments
等等。

經 @張智昱 師兄提醒,補充:其他的有公開資料庫的望遠鏡有Herschel, WMAP, WISE, IRAS, Planck, VLT, HST, Chandra, XMM, SOHO, 等等,而且SOHO(一個空間望遠鏡,觀測太陽的)的數據還是實時更新的: http://sohowww.nascom.nasa.gov/data/。還有伽馬射線爆,實時監測數據:http://grb.sonoma.edu/。

有時候儘管數據還在保護期內,持有人特別慷慨,也可以公開分享給大家,放在自己的網站上,或者Dataverse.org上有一些天文觀測數據,這個網站還在建設中,bug略多...

需要注意的是,如果你用這些分享的數據發文章,要在文中致謝數據的持有人,一般在上面的網站中都能找到標準的致謝格式。

數據的共享是大勢所趨,對自己來說,一方面可以激勵數據持有人在保護期過期之前趕緊出成果(專治拖延症...),另一方面也是一個讓大家幫忙檢查自己的結果的好機會。對整個學術圈來說,數據也是多多益善,而小家子氣地保護數據只會釀成惡果。例如,經常看到BICEP2被黑,因為他們搞的大新聞被Planck的結果質疑了。而據BICEP2組內的人說(=聽說的,對真實性不負責),他們是有苦難言,當初也是要Planck組分享一點河內塵埃極化的數據,好扣除前景,而對方不願給數據,只給了一張ppt里的截圖,他們趕著發文章,就用這張圖擬合了一下...

關於第二個問題,我感覺對數據的操作分為兩個部分,第一步是數據處理,也就是把望遠鏡接收的信號做成可見的圖像、能譜之類的,第二步是數據分析,是對圖像、能譜等做出自己的解讀,找出它們所揭示的物理意義。就第一步來說,我對射電觀測比較了解,所以只說射電,對於比較強的信號,實際上現在的觀測數據冗餘度都很大,不同的數據處理方法出來的結果不會相差太大。比如射電干涉儀的數據,一般都有幾個乃至幾十個天線,對應幾十乃至幾百條基線,就算不同的人因為主觀認知的差異,去掉了一兩個天線的「壞」數據(叫做『flag』),甚至用不同的程序做數據處理,對最後的結果不會有太大影響。很多時候,一份數據按照網上的「傻瓜教程」和按照自己深度優化的方式處理出來的結果,肉眼都看不出啥區別。當然,處理過程中有錯誤就是另一回事了,我記得有一年愚人節,有人在預印本文庫上發了一篇文章,講他用特殊的處理技巧在圖像中做出了很多神奇的圖形,純屬惡意賣萌,也向大家展示了錯誤的數據處理能做出多麼荒謬的結果。(經 @張智昱 師兄提醒,補充)而且,對於比較弱的信號,例如高紅移星系,數據處理也是見仁見智,值得自己用深度優化的方法反覆嘗試。就第二步來說,更是見仁見智了,只要邏輯通順,自圓其說,什麼結論都可以,經常有拿同一份數據分析出不同的結果的事,有人觀測到2*sigma信號就要發Nature Science了,有人覺得2*sigma不靠譜,然後在astro-ph上就「Comments on XXX」、「Reply to the comments on XXX」、「Comments on the reply to the comments on XXX」的吵架,我等無聊的苦力就樂得圍觀了。


望遠鏡得到的數據,在處理的時候,不同的方法、修正等等,都可能得到不同的結果。
且不說不同人的處理之間的差異,就說我自己處理數據的差異,我們的光學觀測(相對簡單的觀測),需要對CCD數據進行本底、平場、暗流等等修正,那麼這些修正參數哪裡來的,也是通過對儀器進行測試得到的,測試本身也有誤差。例如平場,用燈光平場,還是晨昏光平場,還是夜天光超級平場,合成平場的時候,哪些數據要哪些不要,這些都會影響最終得到的平場參數。我們一般的標準是多種方式得到的平場相差小於一定程度就認為是正常的,可是這個一定程度是多少,不同人有不同的標準。
再比如說流量定標,有幾顆標準星參與了校正,用哪幾顆的數據?這些都因人而異。多一顆少一顆,都會影響結果。
所以我們自己的處理數據,我自己發布的,都有好幾個版本,不過呢,如果版本之間的差異小於系統誤差,那麼基本上就認為已經可以了。。。。

至於說數據共享這樣的,前面幾位大牛都解釋得很清楚了,就不多說了。基本上來說,整個天文學界都是在共享數據的,這和其它專業不太一樣。別的專業可能涉及到國家安全,涉及到經濟、政治等等,而天文學則不會。真要是涉及到安全、經濟、政治,那天文學界涉及到的是全球內的,和國家無關~


前一個問題的答案是,一般不。或者,說得更確切些,數據本身不會發布,但全世界的天文學者原則上都可以使用這台望遠鏡獲得他們想要的數據。

望遠鏡的觀測時間,是一項非常非常重要的資源。

如果研究者能夠處在一個擁有望遠鏡的研究機構中,則通常會因為主場的便利,而擁有更多的望遠鏡獨佔使用時間——畢竟,望遠鏡的運營和維護也是燒錢的活計,要是主場人員還不能從中得到一些福利,那也太不公平了;到最後,也許就沒有太多機構願意擁有自己的望遠鏡了。

這種主場優勢會有多大呢?天文界的人,大概都知道 University of Hawaii(夏威夷大學)的江湖地位。這個度假勝地的大學,看上去似乎沒有什麼深厚的底蘊或顯赫的家世,卻又何以成為全球天文學的中心之一呢?無他,夏威夷的毛納基火山頂上有一大堆天文台,其中好些都是由夏威夷大學運行的;主場優勢在此,許多優秀的學者便會被吸引前來。

至於其他一些擁有自己的望遠鏡的學校——比如 UT Austin(德州大學奧斯汀分校),UMich AnnArbor(密歇根大學安娜堡分校)——也通常因此而有著很不錯的天文研究實力。UMich 更是把「我們有望遠鏡,而且不止一台,其中一台專門給系裡學生用」當成天文系招生的賣點之一——不過,時至今日,聽說那台鏡子的狀況並不是特別好,真是可惜。

順帶一說,Arecibo 的超級射電望遠鏡的運營,雖然名義上也有 University of Puerto Rico(波多黎各大學)一份兒,但因為這個望遠鏡的修建動議是康奈爾弄的,也因為兩校在研究實力上的差距,其實運行工作基本都是康奈爾大學的事兒。所以,波多黎各本地的大學其實並沒有從中撈到什麼好處……

如果不佔有主場之利,那麼研究者就要申請望遠鏡的使用時間了。這類申請是要觀測者依照自己的科學目標與攝像,自行撰寫並提交計劃書的,由運營方組織專家,對申請書進行篩選;被選中者,將被安排相應的觀測時間(雖然今日的觀測工作本身,常常是由運營方代勞,或者是通過遠程連接進行在線觀測,學者親自前往天文台的情形已經非常少見了);觀測者獲取數據之後,自行處理,得出相應的結論後,將其發表。這是一項有時有著不小競爭的工作;被一些「熱門」望遠鏡的運營方選中的觀測計劃書,會被視為研究者的一種榮譽,而且會對該研究者未來的觀測申請帶來便利。

為了趕在每個觀測周期的觀測申請截止期限之前提交申請,天文學界的人們似乎總在周期性地忙碌著。那些已經拿到終生教職的教授,一般是不熬夜也更不趕通宵的,但在這個截止期限附近例外。

當然共享數據的鏡子,也不是沒有;而且,在這些鏡子的數據基礎上,往往能有人做出很重要的成果。最著名的之一,就是 SDSS(斯隆數字化巡天)了。這並不是一台太大的望遠鏡,口徑 2.5 m,專門從事巡天工作(看盡量多的天體,雖然每個天體的曝光質量會略欠缺一些,但總體的數量非常多)。他們定期在網站上發布數據,比如說這個:

Data Release 12

全世界的所有人都可以從 SDSS 的門戶上,進行查詢、分類、編排和下載數據的操作。可以說,全世界有四分之一天文從業者直接靠它吃飯,剩下的四分之三也多多少少地是間接靠它活著的。


第二個問題的答案是,是的。

來填坑說說李惕碚老師與 WMAP(威爾金森微波背景輻射各向異性探測器)的恩怨吧。

關於微波背景輻射,請參見這兩個回答的相應部分:
如何找出一個宇宙的 DNA? - 王力樂的回答
目前宇宙中熱門的研究對象有哪些? - 王力樂的回答

這裡再放一次微波背景輻射的全天圖:

人們發現,在多極展開之後,四極矩的數量明顯偏大(指向了一個不太正常的數值,現有理論雖能解釋但很不自然);最要命的,這個四極矩的方向,竟然與太陽系平面的方向是重合的:

人們發現,在多極展開之後,四極矩的數量明顯偏大(指向了一個不太正常的數值,現有理論雖能解釋但很不自然);最要命的,這個四極矩的方向,竟然與太陽系平面的方向是重合的:


整個宇宙中,竟然有某個方向,與太陽系的軸向重合,這明顯有違「宇宙中沒有特殊的點,也沒有特殊的方向」的常識。人們提出了各種猜測和假設來試圖解釋這個;最離奇的是,有人認為,宇宙早期有著非常特殊的拓撲結構,通過某些奇特的機制,導致了宇宙中許多天體的軸向最終對齊到一個方向上去……

李惕碚老師覺得這事兒不對。他在中科院高能所有一個博士生,叫劉皓,冒著博士沒法畢業的風險,與老闆一起,試圖通過檢驗數據處理機制的方式來發現問題。不幸的是,WMAP 組雖然對外公布了他們的原始數據(WMAP 是兩點相關式儀器,原始數據的處理非常麻煩),卻拒絕提供數據處理方法和軟體。於是,他們只好自己摸索。許久之後,他們發現,如果在數據處理中的某一個非常容易犯錯誤的步驟上犯了錯誤,則在那一步中,關於四極矩的有用的信號會被丟掉,剩下的則全是來自地球和太陽的雜訊,而這雜訊似乎正是造成那個巨大且與太陽系平面重合的四極矩的根源。

他們試圖把文章(http://arxiv.org/pdf/1003.1073v2.pdf)發在 MNRAS(英國皇家天文學會月報,天文界三大期刊之一)上,卻立即被審稿人斥為「民科」,處以極刑;換了 ApJ(美國的天體物理學報,天文界三大期刊之首),審稿人非常熱情,也贊同他們的觀點,決定接受稿件,可到最後卻突然再次被槍斃。歐洲的 AA 更是直接擋回,毫無商量。但是,學生必須發文章以便博士畢業,李老師就用自己作為院士的特權,將其不經審稿地發表在國內的某個期刊上。

他們與 MIT 的 Max Tegmark(WMAP 數據處理項目組的首席)取得聯繫,但對方回過一次郵件後便再也不搭理;美國天文學會的年會拒絕他們報名,其他的專門的學術會議也拒絕了他們,直至幾乎所有的在美的相關研究人員都拒絕搭理他們。等這事兒風頭過去,他們試圖去美國參加學術會議,但是不知為何,美國使館連續拒絕了他們的簽證申請。(這事兒還對我造成了一點影響:當時,陶嘉琳老師幫我給 Max Tegmark 套磁兒,可對方一聽說這邊是清華的之後,便立即「拉黑」了……)

有一個歐洲的研究組通過郵件與他們商榷爭執,但最後,歐洲的研究組承認他們說的很可能有道理。當時,歐洲空間局的 Planck(普朗克)衛星正在天上運行,數據處理工作還未全面展開。這是一個對微波背景輻射直接成像的衛星,比 WMAP 有著更高的空間與能量解析度,數據處理也沒有 WMAP 那麼複雜;Planck 的觀測結果,應當能做出相應的裁決。當 Planck 研究組的一個人在外作報告時,幻燈片中展現了一張還沒有完成的微波背景輻射全天圖;有好事者用相機拍下這張幻燈片,回去摳圖分析,發現老李他們說的好像真是對的,並公之於眾。這一事件的直接結果便是,歐空局下令,Planck 組的任何人員,在數據處理完成之前,不得擅自公開使用任何中間結果。

現在,Planck 的最終數據處理結果早已公布;結論是,雖然李老師的結論並不完全正確,但WMAP 得出的四極矩確實有問題和錯誤。

這一段由於數據處理方式不同造成的公案,到此也算畫上一個句號了吧。


基本上是不共享的。一般研究者申請到觀測時間,獲取數據,分析完了數據,才會考慮公開數據。但很多時候是upon request,跟你不熟的話是不會跟你共享的。


推薦閱讀:

水在其他行星上罕見嗎?為什麼?
2015 年 7 月 23 日,NASA 宣布發現 Kepler-452b 意味著什麼?

TAG:天文學 | 天體物理學 | 天文望遠鏡 |