在當前大數據背景下,基於數據的歸納學習能否使得中醫重新獲得生命力?

感謝各位的關注和回復,怪我說的不清楚。我是在看到KBANN演算法後才想到的

因為這個基於知識的神經網路可以以先驗知識作為第一層,通過數據集修正來學習出模型,並且可以通過修正先驗知識的權重來修正知識的不足,那麼這樣是不是可以修正中醫中一些不能或沒有被現代實驗證實的理論呢?

還是我對KBANN的理解有偏差,煩勞諸位解答了

--------------------------------------------------以下為原問題描述-------------------------------------------------------

相比於現代西方醫學體系,中醫更像是經驗主義,看病靠望聞問切,通過觀察現象和長久的經驗積累來行醫。我覺得,這很像統計學習中完全依靠數據說話而不藉助先驗知識(先驗知識指已被實驗或邏輯證明的定理或公理)的歸納學習。

今天,數據挖掘、機器學習等領域發展飛快,而中醫上千年的傳承積累的經驗就像是一個龐大的數據集。那麼我們能否將一些演算法模型應用於這個數據集上,從而推動中醫的發展呢?

另外,如何結合歸納學習和分析學習,我們能否使用數據來修正中醫中經驗知識的缺陷,從而幫助中醫再次發展?


請中醫先融入現代醫學體系


收集數據比較麻煩


自從國家開始把中醫重新拾起來,中醫就一直在跟先進技術一起進步,而不是很多人認為的中醫就是陰陽五行望聞問切。

先來說中藥吧。

到目前為止,幾乎每一種現有的常用的中藥,都被藥學院的前輩們用各種技術去把成分分離,提取研究(對不起,我不是搞藥學的講不太清楚)。有一門必修課叫中藥藥理學,這本書全是用先進儀器和技術去研究中藥成分。(你們說這算是中醫的進步還是跟中醫一點關係都沒有?是不是想起了屠呦呦?)

既然研究了,那就應該有成果啊?青蒿素無疑是最有名的!雷公藤多苷,甘草酸二銨,小檗鹼,麻黃鹼,丹參酮,丹皮酚,川芎嗪,丁苯酞,天麻素,華蟾素,白芍總苷,銀杏葉提取物,斑蝥,紅花黃色素……

是不是都挺眼熟?是不是經常用到?

你們倒是找一家從來沒用過這些葯的西醫院出來?其實中國的西醫早就不是純正的西醫了。我們國家從一開始就是中西醫結合,無論你承認還是不承認。

跑題了……╯﹏╰

這些提取自植物的大分子藥物都是經過了大樣本的動物實驗和臨床試驗才應用到臨床的(有文獻為證)。

人家一直在路上……


在你們閑扯的時候,別人已經開動了。

今後,問診中醫的患者或將接受人工智慧機器人的搭脈診斷,不同人的脈象識別將變得精確。

上海數學中心首席專家、復旦大學數學科學學院特聘教授馮建峰17日透露,復旦大學許田團隊正與上海中醫藥大學合作,開發中醫人工智慧機器人,不僅將原本依賴於醫生主觀判斷的中醫把脈診斷技術精準化,還利用其深度學習能力來分析名中醫積累的經驗信息,使中醫寶庫在高科技時代得到更好的傳承。馮建峰透露,根據計劃,明年3、4月份間,「中醫一號」將面世。

在復旦大學剛剛結束的東方科技論壇上,中國科學院院士楊雄里表示,類腦計算和人工智慧研究是即將啟動的「中國腦計劃」的重要組成部分。

據悉,以闡明腦的工作原理為目標的腦科學是本世紀全球最重要的科學前沿領域之一。2013-2014年,美國、歐盟和日本先後啟動了大型腦研究計劃。在中國,腦科學研究已被列為「事關中國未來發展的重大科技項目」之一,具有中國特色的「中國腦計劃」正在醞釀中,不久將啟動。

中國科學院院士楊雄里表示,認識腦的奧秘是對人類的終極挑戰,腦科學的發展,對腦疾病的防治、信息和智能產業的發展有著巨大的推動作用。他透露,「中國腦計劃」將從認識腦、保護腦和模擬腦三個方向展開研究,逐步形成「一體」(腦認知原理的基礎研究)「兩翼」(腦重大疾病、類腦人工智慧的研究)的研究格局。

復旦大學方面告訴記者,在東方科技論壇上,來自國內外高校、研究機構和產業的60多位專家學者圍繞「類腦人工智慧」,從腦科學的基礎研究,類腦人工智慧的軟、硬體實現,以及類腦人工智慧的社會應用等方面展開討論。專家們還就新一代人工智慧在疾病輔助診斷、新葯研發、智能機器人、自動駕駛、公共安全、金融投資與風險調控、醫學影像等產業領域的應用前景進行了深入探討。

當日採訪中,復旦大學腦科學研究院專家馬蘭告訴記者,上海市政府已將腦科學與人工智慧列為該市重大科技項目,成為建設具有全球影響力的科技創新中心的一個重要舉措。復旦大學方面亦牽頭聯合浙江大學、華中科技大學、同濟大學、上海交通大學等十幾所高校及中科院研究所,成立了「腦科學協同創新中心」,推進腦科學研究和轉化應用,積極推進和參與「中國腦計劃」的實施。

據知,上海市政府聯合中國科學院、中國工程院啟動的「腦科學與類腦人工智慧」重大項目,圍繞類腦人工智慧研發與產業化核心,實施多項任務,包括,構建科學大數據和腦模擬平台;研發類腦人工智慧軟體系統等。


你確定是龐大的數據集?上千年來的經驗有病歷記錄?

==以下純瞎扯===

我不懂醫院,我用外行的觀點瞎扯幾句:中醫的大架構是個五元的topic model(肝心脾肺腎),每個topic又限定了只有陰虛陽虛的2元取值,然後用這個model去套各種疾病。但是這些topicl完全是隱變數,每個中醫各自做一些訓練樣本非常小的最大似然估計……


建構理論體系一般有兩種方式:

一是先尋找最簡單的兩點之間的關係命題,一般通過歸納法,作出全稱判斷,並在發展過程中加入越來越多的附加參數,從而對全稱進行不同程度的限制。如此不斷操作,得出很多類似的關係。

此時,我們需要將這些關係進行整合,但是在整合的時候,一般會發現,這些命題彼此之間常存在著複雜的影響,就像玩魔方一樣,你以為把某個紅色塊移到了目標位置上,但卻發現另幾個原本已經擺好的色塊都變了位置。

之所以會出現這種情況,是因為你所要整合出來的系統整體,原本就是存在的,肯定是先於人類的研究行為之前存在的,那麼系統內部不同層級之間、同一層級的不同元素之間那些海量豐富的非線性關係也是原本就存在的。

凡是有著這種關係的系統,其內部已經被人們發現的那些孤立性較強的命題都不太可能通過簡單的方式進行線性堆砌就建構出這個系統,其過程中仍然要進行大量複雜的修補和調整,結果卻也未必能行。當然,僅憑這些已經的孤立命題,就已經可以使世界很美好了,至少解決了不少問題,但是離大洋彼岸其實還很遠。

這可以看出,我們這種「從下到上、從內到外」的建構順序和思路,本身就存在這樣的固有問題,如果不進行躍遷式的整合,想要理論系統升級,似乎不太可能,儘管技術層面的進步是極為明顯的。

我不太了解大數據,但想來,應該是在複雜的數據當中,找到兩個元素之間較為固定的關係,並建構成命題,雖然很多時候不知道這種關係的本質屬性是什麼。

用這種手段建構模型系統的本質跟我前面的描述是一樣的,在它是孤立命題時,可以發揮非常巨大的作用,揭示某些固有關聯。

但是別忘了,我們面對的是人,人在疾病和健康方面所真實包含的規律性,可並不是幾條孤立命題就能簡簡單單堆砌構成的。不過這種手段倒是可以揭示很多基本屬性。只是規律性在技術上的價值一般是遠大於屬性的。

二是「由上到下,從外到內」的建構順序。

先將所要研究的對象的全體集合在一起,然後居高臨下用簡單的幾種屬性模式將集合內的元素劃分成幾個小組,每個小組都具有一種屬性。在每個小組內部,還可以用這種手段繼續向下劃分。因為這種理論模型內部的元素內涵是高度概括性的,所以這種理論模型能夠表現出哲學色彩。

因為在原初行為中,分組屬性本身就是人為定義的,因此不需要被證偽,那樣沒有意義。關鍵在於,所想到的這些屬性,在數量上夠不夠,能不能囊括所有現實中常規可見的屬性類型。

你說外邪主要是風寒暑濕燥火,稱六淫,那還有沒有別的邪氣,所表現出來的屬性特徵明顯不屬於這六種屬性模式的?

答案是有,後來溫病學派找到個「疫癘」之邪,往六淫里放,怎麼都不合適,於是獨立被定義出來。

其他難以歸類於六淫的邪氣類型應該也有一些,但是在屬性成份上大體都可以用六淫來組成,所以算是合邪,也就不再增加新名目了。

除了理論分型,人們還用相同的理論指導技術實踐。

在這個過程中,如果用這樣的理論所指導的實踐不能治病,而且長期無法修正,那只有兩個結果,一是系統崩潰,被拋棄,一是由於沒別的可用,於是繼續使用。所幸,只要辯證正確,治療明顯顯效。

但問題出現了,這種模式下建構的理論系統,從一開始就包含著系統內部元素間複雜海量的非線性關係,因此技術層面極具難度,因為每一個證型的組成元素都頗複雜,麻煩的是,入組元素的成份並不能直接代表證型的本質,只是基礎而已。

甚至很多時候哪怕多一個元素,或少一個元素,對證型的結果都沒有什麼影響。這種初始條件有限大差異不導致結果顯著變化的線性關係,是中醫人想看到的。

但有時候,只要稍微差一點,證型就會發生明顯的變化。這種初始條件無限小差異就導致結果顯著變化,誰他媽都不想遇到。但是,這是客觀存在的。

所以準確辯證是一種極難的技術,畢竟它不符合正常人日常的思維習慣,是要進行專業訓練的。

也許有人會認為,這種模式下的理論系統是不是過於粗糙了。

我想說,科學性的程度與精細程度並不存在著必然的關聯性,精確描述本質上是技術訴求,而不是科學訴求。絕不是越精準就越科學,而是跟現實規律性貼合得越近就越科學。所以科學的理論,也可以是粗糙的,也可以是精細的。

我想,在一個充滿海量非線性關係的龐大系統中,一般都會同時存在著不同的尺度層面,每一個層面都會有一套相應的規律性表達,那麼在大尺度層面上,其規律性的形式表達,一定是粗糙的,但是無所謂,因為它是科學的。

可見,在中醫正確辯證的背景之下,大數據所擅長的揭示兩點關係並建構孤立命題的長處,和整個系統大尺度層面上客觀存在的規律性相較其實是沒有可比性的。

並不是大數據沒有價值,而是你面對的系統層面不適用你這種工具,除非你提升你的適用範圍,或者你面對的對象並不具備這樣的內在屬性。

建構中醫的每一個證型時,基本都包括眾多參數,但證型的本質與參數的組成並無絕對關係,與每個參數的程度也無絕對關係,而是與諸參數構成什麼樣的整體格局有關。

像這種模型,由小尺度層面上的元素整合成某種格局,於是形成大尺度層面上的基本單元,這個單元是不應該被拆分的,因為只有這個單元以整體面貌出現,「才」具備某種意義。

我知道這種模型很煩,不好計算,不好處理。但事實如此,它們就是這樣的,強行用不適合的標準去評價是削足適履。

比如太陽病,小尺度上的基本元素主要是脈浮、頭項強痛、惡寒,同時也可以有其他多種癥狀,共同構成大尺度層面上的太陽病。但並非這些癥狀簡單堆砌在一起就成了。因為太陽病的本質格局是「邪氣襲表,榮衛受擾」。只有構成這個格局,才是太陽病的本質,才能最終確定。

但中醫的證型很有意思,那些非主症的癥狀,有時候多一個或少一個,常並不影響太陽病的診斷,甚至有時候主症缺乏也可以不影響證型的判斷,比如寒邪束表嚴重的時候,脈在早期常是不浮的,而是表現為沉。但它仍是太陽證。

而這些癥狀各自的程度,也是有時候有意義,有時候沒太大意義。

此外,對於證型的建構,除了這些相關性癥狀,還要同時考慮排除不應該出現的癥狀或癥狀群。因為他經病也常常表現得跟太陽病相似,可能僅差一個微小的癥狀,也不屬於太陽病了。可見,兩個大尺度上的不同證型,可以同時共有某種或某些小尺度元素。

這種微妙的結構,其實從某個側面反映出,各元素、各單元、各層級之間所固有存在的複雜且密切的交互關係。

而這些都需要臨床中醫師對於抽象的太陽證本質格局進行綜合複雜的思考。

可見,並非沒有標準,只是標準並不簡單,而且處於動態變動之中。一個本可以簡潔表達的系統內部的命題,如果將其背後實際應該表達出來的條件內容都表述出來,那實在是過多了。

這種理論建構模式,以有限的屬性類型對對象進行分類分組,使同一集合內部具有若干不同群組,且每個群組都有專屬的特徵。

如果只有兩組,那麼表面上雖然看似命題B和命題非B,但其實是命題B和命題A。這兩者是完全不同的,後者攜帶著專有屬性。

在辯證識別時,如果真實證型是A,那麼AB這兩組子集合,A提供本我趨向,B提供非我排斥。中醫師通過這種思路,最終確定證型是哪一組裡的。

可見,通過這種模式建構理論系統,最大的優勢有兩點,一是從一開始就覆蓋較全面,基本上無出其外者,雖然後世不斷有新病出現(按現代醫學的標準),但中醫作為模式學,只要證型模式不變,治療方法和預期效果也是不變的;二是從一開始就包含所有的複雜關係,不用擔心整合時必然出現的麻煩,只不過技術掌握起來有相當的難度。

缺點是粗糙,但因為貼近這個層面的規律性,所以粗糙並不能成為真正的缺點。

綜上(其實還有很多內容沒有表述),大數據這種技術工具,如果想建構中醫理論模型,我個人覺得應該用「本我趨向」和「非我排斥」的程序結構,而不是簡單的海量對比。這種「非我」和「本多」的結構模式,我個人猜測跟人腦進行人臉識別的機制是相近的(具體內容不在本答案中表達)。


不能,中醫是經驗(藝)醫學


http://weixin.qq.com/r/qn5zaybEbXsSrWII9yu4 (二維碼自動識別)


真有大數據,中醫將無處遁形。醫學上通過一種新葯也就幾百病例的臨床實驗就可以了吧(不是很了解),中醫先把這關過了吧。


大數據早就有了,中藥指紋圖譜不就是大數據嗎?

有大數據又怎樣,還不是繼續在背中藥學。

這麼多化學成分,誰記得住。


推薦閱讀:

如何看待《大數據時代》中提到的「不是因果關係,而是相關關係」,對科研有什麼啟發?
在實體經濟一片下滑的大環境中,哪些行業還可以?
基於大數據的成功應用有哪些 ?
美國致力於大數據分析的公司有哪幾個?
做大數據開發好還是大數據分析比較好一些?

TAG:中醫 | 數據挖掘 | 統計學習 | 大數據分析 |