英國生物庫數據對外開放有哪些意義?國內是否有類似的資料庫?
我猜提問者說的是這個新聞: Biobank promises to pinpoint the cause of disease http://www.newscientist.com/article/dn21650-biobank-promises-to-pinpoint-the-cause-of-disease.html
文中有寫道:"It"s the biggest, most detailed collection of data that"s ever been put in place," says Rory Collins, UK Biobank"s founder. Its impact on dissecting the causes of disease, he says, will be as profound as the invention of the telescope was to astronomy, or the microscope to microbiology.
這個資料庫之於疾病治療的意義的意義, 可以和望遠鏡之於天文學, 顯微鏡之於微生物學媲美. 我個人覺得, 真是言過其實了.......
不說我們對於很多疾病的具體機理還有很多不清楚的地方, 也不說即使對於機理比較清楚的疾病, 從科研到臨床引用的慢慢長路, 就說資料庫中具體的數據處理和分析方法, 以及最後能得出什麼結論都是未知的. 當然, 如此豐富而且詳盡的數據, 特別是樣本之大(500,000)和時間之長(30年), 對於疾病產生和其它因素的相關性研究將非常有用.
文中還有提到:China has a similar database, called the China Kadoorie Biobank, which also contains the health details of 500,000 volunteers, but Rory Collins says that the UK version has more information on each volunteer. The two are complementary, and could be the focus for joint studies, he says.
The Chinese project hints at the kind of results the UK Biobank might turn up. It has found, for example, that thinner men are more at risk of developing chronic obstructive pulmonary disease in China, and that major risk factors for heart attacks include diabetes and psychosocial stress.
中國也是有相應資料庫, 中文名叫"中國慢性病前瞻性研究項目", 科學網07年已經對其作了詳盡的報道http://news.sciencenet.cn/htmlnews/200711284331281193210.html, 引述如下:
當今,全球化已經成為資源有效配置的主導方式。以創新為核心要素的RD活動,也正通過各種合作 共贏的方式體現出強烈的全球化特徵。作為其中的典範,「中英科技」(UK-CHINA Partners in Science)雙邊合作計劃已經在第一階段(2005-2006)取得了卓越的成就;目前正處於第二階段(2006-2008)的合作計劃,也進展順 利。據悉,英國與中國的科技論文合著數量,目前已超越任何其他一個歐盟國家;在基礎性研究領域,英國正成為歐盟國家中與中國進行科研合作頻率最高的國家。
陳錚鳴說,慢性病的危險因素可以分為3個層次。一是現有的已知危險因素,比如吸煙、肥胖 等,但目前這方面的研究還不夠。KSCDC將為現有危險因素的分析提供一些新的數據,這是非常有價值的。二是對選取不同疾病的判定指標提供更具說服力的數 據,如對糖尿病來講,腹圍可能要比身高、體重更具有價值,是更好的指標,KSCDC可以幫助我們在今後的研究中創建更為精確的指標,而不是籠統地說一個人 太胖或太瘦了。三是發現一些新的危險因素,如我們過去對不同類型的血脂研究不足,通過KSCDC大樣本量的分析,我們有可能得出更精確的結論,即了解某種 類型的血脂在慢性病發病中的作用。
KSCDC不僅要解決慢性病流行病學研究中「質」的問題,還要解決「量」的問題。陳錚鳴認 為,現在很多慢性病流行病學研究還是比較「粗」的,即使一些現有的危險因素,一些精確的細化問題也沒有得到解決。隨著技術和手段的不斷進步,KSCDC除 了可以幫助研究人員研究一些宏觀的危險因素外,還可以了解一些更細微的危險因素,達到分子水平甚至深入到基因水平來確定哪些可能是易感的因素,這樣對於了 解疾病的發病機理,為今後探討疾病的控制手段,提供有價值的科學依據。只有做到深入細緻的研究,才能有的放矢地指導慢性病流行病的防治工作。
生物樣本庫的真正價值在於數據,開放可以讓本來沒有發揮其最大價值的數據,在開放的過程當中快速的膨脹,迭代式的新的數據的產生,全球的科學家的只是把這些數據進行不斷地刷新,最終形成一個科研的大數據,這就是她真正的價值。中國還沒有類似的生物樣本庫,也很難有,因為中國的科研機制很難誕生這樣的一開放和共享為基礎的平台,但我們在努力的去追求。
推薦閱讀:
※如何設計並實現一個 DBMS?
※國內哪些互聯網公司使用了 Cassandra 資料庫?
※一個不聰明但勤奮好學能吃苦的女孩紙 適合做DBA嗎?
※OLAP中roll-up和drill-down和slicing?
※GPU 資料庫 MapD 性能超傳統資料庫 70 倍,資料庫瓶頸不是 IO 嗎?