是否有中文或英文的醫學辭彙集,包括主要的專業術語和通俗講法,比如病症、疾病名以及治療方法?

通俗講法不強求,病症表述可通俗,如心絞痛、胃疼等;疾病名稱如冠心病、十二指腸潰瘍;治療方法亦不強求多少,如手術、散步、少食多餐等。

像SNOMED和WHO的專業術語集算是比較滿意的,但是希望能有這些功能:中文;辭彙間關係,如分類、包含結構等;加入一些通俗的講法和治療方法;能將疾病和病症對應,或者疾病與療法對應,等。

如果只有上述的部分功能也沒關係,請各路大師大神支援!


由於本人曾在哥大醫學中心學習醫療信息學,現在又回國做類似的項目,故在這裡用個人經驗回答下題主問題。

首先說一下行業情況。類似中文版SNOMED CT或UMLS是沒有的。然而,各大醫院信息系統(HIS)廠商及其他院校或醫院都有各自的私有術語庫。當然,這些作為非常寶貴的資源,是不會被公開的。國內一些行業協會等一直在籌劃購買或翻譯SNOMED等國際術語集,然而由於授權費用和領導架構等問題一直沒有實質性進展。一些NGO也正在豎起大旗嘗試以公益性質開始統一數據標準,然而,落實到真正誰來做術語集和知識庫的問題時,又不可避免的落入權責不明確,約束力不強的死循環。試問,有哪一家真正花大成本收集並標準化醫學術語的公司或機構會願意無償發布這個標準?即便發布了,他的可用性和可擴展性又有多強?

再根據我的一些個人經驗說一下做中文醫學術語集的一些問題。因為正在上海做類似的事情,所以有些一手經驗和教訓。之前在美國做醫學術語分析、臨床決策支持非常順風順水,但回國遇到的很大麻煩就是:1.找不到中文標準術語集;2.中文辭彙間不像英文有空格,所以分詞關首先就有難度;3.中文臨床數據的標準程度遠不如美國,寫法表述方法各異,導致在沒有知識庫的狀態下很難做中文NLP。4.國內對此事情的認知度不高(除非一些留過美的醫生),往往採取急功近利的(例如模式匹配)方式來完成一定程度的自然語言處理。這類方式可以很快達到如70%的準確率,但再網上就難了。

由於我們從美國回來就是想把醫學數據和醫學人工智慧的事認真做起來,所以我們選擇了比較紮實的解決方法,想快速出成果的請繞道。我們的一些解決方法是:1.整合公開的所有醫學詞典,儘可能包含更多的標準醫學辭彙;2.收集各科室真實病例數據,尋找醫學專業人士人工分詞和標註病歷3.使用機器學習演算法,基於人工標註結果訓練NLP模型;4.構建知識庫,並完全對應UMLS或SNOMED CT等國際標準知識庫。現在根據上述積累,我們的病歷標註精確度已經大概達到85%-90%,後期還會進一步提高。如果有任何類似問題,可以搜索森億智能或直接聯繫我。


SNOMED術語量和應用場景是很廣的,存在問題:一是中文版停滯在2000年以前,醫情所的合作和翻譯工作暫停了,二是本地化問題,語種和表達習慣的問題導致英文版很多術語用不上,比如異形拼寫詞條(例如 anaemia 和 anemia),同樣中文的一些俗稱、縮略語等詞型是翻譯版本中欠缺的。目前協和醫情所在翻譯和構建中文UMLS,中國中醫研究信息所在做中醫的UMLS,希望建設中文版的醫療術語標準體系,還處於研發階段。我本人任職過的兩家公司一個從事新聞出版行業即中文最大的全文資料庫數據和服務公司,參與過基於中文MeSH詞表、中圖分類法、漢表等受控詞表和分類體系,構建術語標引詞庫,含同義詞和近義詞等詞間關係;另一個公司是從事醫療信息化服務尤其醫療保健大數據處理,基於ICD10、ICD9CM3、ATC等術語體系構建同義詞、近義詞庫,同時構建了疾病與藥品、疾病與診療、疾病與癥狀等一系列結構化的知識庫。以上可在大數據環境下應用。不知你的需求和應用場景是什麼,感興趣可進一步交流。


推薦閱讀:

馬上要去醫院實習了,有什麼防身裝備或者防身術推薦嗎?
植物人能夠重獲意識嗎?
或許,人人都生而「精分」——20世紀「裂腦人」研究

TAG:疾病 | 治療方法 | 醫學 | 專業術語 | 病症 |