基因數據管理項目,用大數據為基因做匹配
2013年5月美國著名影星安吉麗娜朱莉登報稱她因攜帶BRCA1基因突變而預防性地切除雙側乳腺。乳腺癌是婦女最常見的惡性腫瘤之一,目前發病年齡已提前,且發病率亦成上升趨勢。其中有不少乳腺癌患者伴有遺傳基因突變,而該遺傳基因中最引人注目的是BRCA1基因。是否能提前預防?是否能在發現的初期就進行治療?是否能痊癒?這些問題已經引起萬千女性翹首以盼。
對於這些問題,科學家們忙碌地穿梭於各實驗室之間,希望在源頭就能幫助人們預防並且擺脫病魔的困擾,他們通過大量的實驗得到關於基因的數據,而這些數據之間的鏈接點如何分析是他們目前所不明確。「從基因數據上來說,他們需要知道這種疾病是從哪個演變出來的?我們就是幫助他們通過基因數據來了解起源。如果他們知道這個病是怎麼出來的,那麼他們就會知道怎麼去解決這個問題。」基因數據管理的創始人丹佛尼如是說,「我們的項目可以為科學家們提供諸如生物學為首的基因方面的數據,通過我們的人工智慧平台來尋找和科學家們研究的數據之間的連接點,幫助科學家找到新的機會來改進完善他們的實驗。」
這位畢業於佛羅里達大學專修金融和中文的基因數據管理項目創始人已經在中國生活了6年,曾任職於投資的方向立足於生物科技、電腦硬體,化學研究等領域的風投公司,之後輾轉投身於一家從事環保科技的公司,與此同時,他還在國外開發了一個收集數據的平台,諸如檢測二氧化碳中對空氣造成污染的物質,提高能源使用率等。
據介紹,在中國目前已有兩家公司正在做基因數據的項目,他們的數據僅限於基因或者是關於化學上的一些智能小分子。丹佛尼的數據卻可以包含所有內容,不僅僅是基因和化學方面的。在國外也有類似項目,比如IBM WATSON,它也能提供全局觀的數據。相比而言丹佛尼的軟體可以對數據進行模擬分析,通過三層模擬數據,幫助科學家發現新的科研機會,為他們的實驗提供與之相匹配的努力方向,產生更好的市場效果。
目前,該項目的產品還在研發階段,預計今年九月可以正式上線。現在已經開始為感興趣的客戶提供相關方面的諮詢服務。後續產品的使用是由付費和免費兩部分構成。用戶依據自己的研發需要購買伺服器來使用資料庫中相對應的數據信息,每個伺服器售價為三萬美金。由於單個伺服器的存儲空間有限,因此用戶需要根據自己的使用情況來購買伺服器的數量,並且基於使用的伺服器數量來支付年費。丹佛尼的公司還會提供後續的軟體升級維護,伺服器終端上的數據更新等其他增值服務。
本項目自啟動以來,已完成種子輪的融資。正在尋求50-80萬美金的融資,團隊共有13名成員,5名在非洲,5名在深圳,還有3名在香港。計劃今年再吸引一位中國籍科學家加入團隊。
近年來,生命科學研究中,基因數據這個詞早已不再陌生。但是,在科學界基因數據對科學家們的意義多半還在停留在參考查閱上,對實際科研成果的推動力卻非常有限。然而,相較於西方國家相對先進的科學實驗成果,中國在這方面的數據維護與存儲更顯匱乏。有了丹佛尼這個項目的誕生,科學界將再度掀起一場基因數據的風暴,讓我們拭目以待。
推薦閱讀:
※終於等到你!全棧數據課出書了!
※10676 怎樣暴力讀取二進位數據文件
※數據查詢,網站在手人無你有
※Business English: How to describe data?
※咦,我的 個人主頁動態 有點異常呢?