請問SNOMED CT的牛逼之處在哪裡,SNOMED能做什麼用?
醫學,醫療信息化,HIT,HIS
大家說的都很專業,那我這裡就補充點現實點的。本人哥倫比亞大學醫學信息學畢業,現在在上海做醫學自然語言處理相關的創業項目。所以有一些一手資料與大家分享。
雖說知識庫、本體(ontology)這一類辭彙非常形而上(很多的確是出自哲學範疇),但其真實的應用卻非常直接,以下用我平常遇到的一些醫學領域裡的問題和解決舉例,歡迎各位補充指正!
1.臨床信息檢索
先說個簡單的,臨床數據分析中有時候要進行病人檢索。例如,我需要從病例中找到所有癌症患者,然後做分組分析。那問題來了,如何找到所有癌症患者呢?有人說直接搜「癌」或者「癌症」唄。的確,這是最直觀的做法。那萬一有時候表述方式就是「腫瘤」呢?有人說可以把所有癌症的相關名稱列下來,從病例中關鍵詞匹配,找出對應的病人。bingo!關鍵詞匹配是現在使用比較廣泛的方法。再細一點,我們看看收集來的關鍵詞,裡面有些層次是不同的,如「肺癌」之於「右下肺小細胞癌」(注意此處用肺癌為關鍵詞就無法找到);另外一些則是同一種癌症的不同表述方式,例如縮寫。對於這兩類信息,我們覺得應該這樣組織信息:首先需要有一棵樹(類似「眾」字的樹),每一個節點都是一個癌症(承接上述例子),越處在上層的節點越普適、越往下越細緻。另外對於每一個節點都有多多少少不用的詞可以代表這個節點的同一個意思。這樣,長舒一口氣、我們有了個大概的東西可以代表這個領域的知識了。
其實,我們剛剛已經完成了一個知識庫的簡化版本,SNOMED CT也好UMLS等也罷都是這一類東西的複雜版本而已。所以有了這麼個知識庫,我們可以容易地實現醫學信息的組織和檢索了。
2.資料庫構建與維護
國內醫學生的一個普遍工作就是做臨床回顧性分析,從上千份文本病歷中搜索病人信息,摘取進excel,後期導入spss進行統計分析。這個過程耗時耗力(我們回來做的森億智能就是個能讀懂病歷的人工智慧演算法,這個不做詳述,可以聯繫我微信1075025780私聊)。但總而言之,廣義來說每個科室都有不少的資料庫。然而這些資料庫之間如何交流與傳承(時間維度與空間維度)就成了問題。很可能的是耗時耗力做的資料庫就用在了一篇文章中就無法再次使用了。這個浪費是巨大的。而有了知識庫,如果我們每次收集的變數都能對應到之前說的「樹」上的一個節點,是否不同來源的資料庫就可以交流了,並隨著精力的不斷傾注而逐漸擴大成長。其實SNOMED 與UMLS都是一個知識庫不斷累計擴展的結果。3.醫學信息標準化與智能輔助說了這麼多,其實大家也應該能看出來知識庫只是一個標準,一個人類對於某個領域知識的一個分類分層的總結概括。有了這個東西,我們不禁可以展望,是否基於這個標準化的知識積累,之後的誤診會不斷減少、決策輔助會更加完善、人工智慧會發展到一個新的高峰?所以這樣想的話,醫學知識庫就是醫學領域裡的E=m*C^2,它總結並涵蓋了醫學的事實,並優雅地組織成了一個自洽的體系。基於它,我們可以做的還有很多!強烈建議題主在https://www.ncbi.nlm.nih.gov/pubmed/ 以SNOMED CT為關鍵詞 搜幾篇綜述先看看亦或關注微博大神「神馬波羅蜜吃貨仁波切的微博」的「三個月學習SNOMED CT系列」你說一本新華字典能有什麼用 能有什麼nb之處
結合自己參與術語相關的一些經驗作的回答,據我了解SNOMED CT是比較完整的臨床參考術語集合,在整個體系裡面包含了臨床很多方面的術語,按照我們國內的系統的劃分的話有藥品、檢查、檢驗、疾病、診斷等等;但是我個人覺得SNOMED CT再提供了一套參考的標準術語的同時提供了一套術語管理術語的方法,包括概念、編碼、關係、屬性等一系列管理。
SNOMED CT/ULMS等這些術語標準真正的在國內應用起來應該還是比較少的,但是ICD 10應該整體會好點,這個跟我們國內系統相對不統一,醫療整體環境還不規範有關係。甚至在有些醫院內部同樣一種概念的術語都存在的不同的情況,比如檢查項目,HIS可能使用的國家標準的收費項目目錄,而RIS可能使用的醫技科室那套,這種情況很難說去建立一套標準的術語。
針對術語這塊,我們做過一些工作,主要是利用SNOMED CT與UMLS建立一套適合國內醫療環境的標準術語集合,這個工作主要包含術語翻譯、國內國標映射、私有術語映射等等,工作量巨大無比,所以我們最後的做法是針對某家醫院已有的術語進行標準化工作,為某家醫院建立標準術語,同時利用術語服務去管理與私有術語的映射關係及標準術語集合。你不覺得SNOMED-CT是拿來數字化生命的最佳ontology系統么~~~秒殺ICD這種局限於疾病的老東西
最近在用SNOMED-CT給電子病曆數據打標籤。這貨太龐大了,格式化做得還是不夠好。有些奇怪的關係,比如genome是gene的子節點~~想必樓主也是同行。SNOMED CT是目前最全面的臨床概念和術語系統,幾乎所有臨床類別的概念都包含。每個SNOMED CT概念被賦予了唯一的概念代碼。其主要目的是為了記錄表達個體醫學狀態和癥狀,在此標準下支撐用編碼表達臨床信息。
從現代術語學理論研究的角度與提高標準化術語實用性的角度來看,建立概念體系、完成概念精準定義、編織概念系統化的語義關係網路,是領域術語標準化研究的標誌性成果,也是標準化術語集能夠理想地支持實際工作的基礎。SNOMED CT服務於信息化臨床科研工作,為病曆書寫與數據挖掘提供標準化術語支持。 由於有了標準化術語支持,就能進行統計分析與數據挖掘,應用包括了如電子病歷、醫囑錄入、實驗室管理、葯事管理、臨床路徑等。補充一點,SNOMED CT作為一個本體資料庫,可支持多語言環境使用。如果通過大量人員的努力,可以幾乎完全消除中文、英文和計算機術語之間的語言歧義與隔閡,在任意醫學知識之間實現完全沒有歧義的轉換。
如果從偏頗一點的角度來看,可以把SNOMED CT比作十幾年前弱化版的Google翻譯。當時的google翻譯功能也是一塌糊塗,邏輯狗屁不通,當時Google翻譯能做什麼用呢?目前的SNOMED CT也處於類似的狀態。首先,它只能把計算機語言翻譯成各種自然語言,而且只能翻譯專用的醫學領域知識。第二,只有通過人工的方法來建立類似的字典庫,並進行校驗核對,如同19世紀編寫牛津字典一樣,需要耗費大量的人力物力。SNOMED CT還需要大量人員的努力,才能做到精確記錄所有醫學知識,實現在任意在語言,對各種醫學術語的精確轉換。但僅僅完成這一點,就能在臨床醫學上促進信息記錄,改善對病人的護理,從而延長人類平均壽命。
法拉第發現電磁感應之初,有人質問:法拉第先生,這有什麼用呢?
法拉第回答:女士,請問一個新生的嬰兒有什麼用處呢?
SNOMED CT的牛逼之處在於可以全面、沒有歧義地描述醫學概念,以達到不同EMR之間可以互相理解、互操作的目的。
SNOMED CT很牛逼,這沒有問題。把它用起來一樣牛逼,甚至更牛逼。除非國家強制,這玩意是沒有動力去推廣的。能遵完全從一堆WS-XXX就不錯了。
國內有sinomed
snomed有200萬個醫學概念,概念都被摁到了50多種語義關係里,而且在成員國,免費,比如米國,香港。
一般來說,作用是用於文獻的文本挖掘,病歷挖掘,醫院信息化。
不過針對中國的情況:值得學,沒法直接用。
中國大陸不是成員國,難推廣中文論文。。。病歷。。。醫院信息化系統換一代之前。。。總之可以學來翻譯整合到fhir,提高互操作的可行性。在中文場景下就是屠龍之術。@鄧小偉 回答的相當精到。補充下維基百科的內容:SNOMED CT(Systematized Nomenclature of Medicine -- Clinical Terms,醫學系統命名法-臨床術語,醫學術語系統命名法-臨床術語),是一部經過系統組織編排的,便於計算機處理的醫學術語集,涵蓋大多數方面的臨床信息,如疾病、所見、操作、微生物、藥物等。採用該術語集,可以協調一致地在不同的學科、專業和照護地點之間實現對於臨床數據的標引、存儲、檢索和聚合。同時,它還有助於組織病歷內容,減少臨床照護和科學研究工作中數據採集、編碼及使用方式的變異。目錄 [隱藏]
- 1目的
- 2設計
- 2.1組成要素
- 2.2基本設計原理
- 2.3特性
- 3用途
- 3.1採用SNOMED CT的計算機應用程序示例
- 4歷史
- 5參考文獻
- 6參見
- 7外部鏈接
目的[編輯]
在指稱同一事物的時候,不同的臨床醫生和醫療衛生機構往往會採用不同的臨床術語。例如,對於心臟病學專科醫師來說,心臟病發作、心肌梗死以及MI可能指的是同一含義,而對於電腦來說,三者之間則全然不同。因此,不同的醫療保健服務提供者、醫療服務設施、研究人員以及其他相關方之間需要協調一致地交換臨床信息(語義互操作性);而且,不同的地方對於醫學信息的記錄方式也各不相同(如採用紙質記錄或者採用電子記錄),因而需要一種廣泛全面而又協調統一的醫學術語系統(medical terminology system),作為信息基礎結構(information infrastructure)的組成部分。
設計[編輯]SNOMED CT是一個組配式概念體系(compositional concept system,組合式概念體系)。這就是說,可以通過與其他概念的組合,對概念加以特化。SNOMED CT是以描述邏輯為基礎,在設計上便於將內容作為一種動態資源加以維護。
組成要素[編輯]- 概念:每個唯一性數字型代碼、唯一性名稱(全稱,即Fully Specified Name)和描述(包括一條首選術語和一條或多條同義詞)所指定的基本含義單位。
- 描述:賦予同一概念的不同術語或名稱(同義詞)。
- 層級結構:19 個高級層級結構;每個高層層級結構又分別具有各自的子級層級結構。
- 關係:用於在同一層級結構之內或不同層級結構之間將不同的概念聯繫起來。
- 子集
[1]
基本設計原理[編輯]
284196006|Burn of skin|:
{246112005|Severity|=24484000|severe,
363698007|Finding Site|=
113185004|Structure of skin between fourth and fifth toes|:272741003|Laterality|=7771000|left|}
與SNOMED CT特定發布版本之中所已經收錄的那套實體相比,此類表達式屬於是所謂的"後組配型"(post-coordinated,後組型),而前者通常從總體上稱為"先組配型"(pre-coordinated,先組型)概念。不過,這些先組配型概念之中的大多數(85%)當前實際上還屬於是原初型實體(primitive entities)。
注意:在其他的上下文(語境)或項目之中,"coordination"一詞可能並不是指對某個候選新建表達式的詳細說明,而可能是指在多重層級結構之中集成某一概念的後續操作(也就是對此概念加以分類)。然而,在SNOMED CT術語集之中,當說到已經對某一表達式進行了"後組配"的時候,並不意味著同時也對其進行了分類。
在同時顧及到SNOMED CT發布版本數據集之中已經收錄的那些概念以及最終用戶群體所已經創建或有待創建的任何其他特別概念的情況下,對於任何此類後組配型表達式的可靠分析和比較,的確都相當需要運用某種合適的描述邏輯分類演算法。截至2007年,SNOMED CT的內容將其本身局限於EL++形式體系的一種子集;SNOMED CT將自身局限於下列運算符:
top, bottom
primitive roles and concepts with asserted parent(s) for each
concept definition and conjunction but NOT disjunction or negation
role hierarchy but not role composition
domain and range constraints
existential but not universal restriction
a restricted form of role inclusion axiom (xRy ^ ySz =&> xRz)
在不久的將來,可能會對其邏輯加以擴展,從而將一般概念蘊含公理(General Concept Inclusion Axioms)包括進來。
理論上而言,為了評估其究竟是早已在世界範圍內分發的那370,000個先組配型概念之中的任何一個已有概念的父概念、先祖概念、子概念或者其他後裔概念,還是在語義上與之等價,可以將描述邏輯推理應用於任何新的候選後組配型表達式。不過,部分隨著與CTV3之間合併產物的不斷沉降,2007年SNOMED的內容之中依然含有未被發現的語義重複性原初型概念和定義型概念。此外,許多概念依然歸屬原初型,但同時它們的語義卻又可以利用同時存在於該系統之中的其他原初型概念和作用關係(roles)加以合理合法的定義。正是因為語義內容之中的這些疏漏之處以及實際或可能存在的冗餘,各種用來推導歸類關係或語義等價關係的演算法在實際當中的性能必將不夠完善,但程度卻無法預知。
特性[編輯]
採用同一部諸如SNOMED CT之類的標準術語集來記錄信息的好處,與採用電子照護記錄以及採用結構化形式記錄臨床信息的那些好處息息相關。
- 在所有的照護領域之間提供一部協調一致的術語集
- 可用於精確記錄臨床信息
- 具有內在的固有結構
- 是一項處於不斷發展(或者說制定)之中的國際標準
用途[編輯]
SNOMED CT是美國聯邦政府指定的一套數據標準之一,旨在用於臨床信息的電子交換。
採用SNOMED CT的計算機應用程序示例[編輯]- 電子病歷
- 計算機化醫囑錄入,如電子處方或實驗室檢驗項目申請錄入
- 重症監護病房遠程監控
- 實驗室檢驗結果報告
- 急診室表格記錄
- 癌症報告
- 基因資料庫
[1]
歷史[編輯]
2002年1月,SNOMED RT(SNOMEDReference Terminology,醫學術語系統命名法-參考術語集)與英國國家衛生服務部(National Health Service,NHS)的臨床術語(Clinical Terms,又稱為Read Codes)相互合併,並經過擴充和結構重組,從而形成了SNOMED CT
[2]
。SNOMED RT在歷史上的優點就是它的那些專業醫學術語集以及所採用的分散式協作開發方法,而第3版臨床術語(Clinical Terms Version 3,CTV3)的優勢則是它在全科醫學方面的那些術語集
[3]
。通過把這兩個體系組合起來,SNOMED CT目前成為現有任何語言之中最為廣泛全面的臨床詞表,收錄有超過344,000個概念,涵蓋了臨床醫學的大多數方面
[2]
。SNOMED CT還與其他的術語集之間進行著交叉映射,如ICD-9-CM、ICD-O3、ICD-10、實驗室方面的LOINC以及OPCS-4。SNOMED CT還支持ANSI,DICOM,HL7,and ISO標準
[4]
。2002年4月,發布了SNOMED CT 西班牙語版;2003年4月,發布了SNOMED CT 德語版。
美國國立醫學圖書館(National Library of Medicine,NLM)代表美國健康與人類服務部(Department of Health and Human Services, HHS),就核心SNOMED CT(包括西班牙語版和英文版)及其不斷更新的永久許可證,與美國病理學家協會(College of American Pathologists,CAP)之間簽署了一份協議。這份合同旨在為NLM提供一份永久性的許可證,以便在NLM的一體化醫學語言系統
[5]
UMLS Metathesaurus之中分發SNOMED,在美國國內供美國政府(聯邦、州、地方和屬地)和私營組織機構免費使用。這份合同同時還涵蓋了美國病理學家協會在2003年6月30日至2008年6月29日之間所發行的對於SNOMED CT的更新。
2007年4月,國際衛生術語標準制定組織(International Health Terminology Standards Development Organization,IHTSDO)收購了SNOMED CT。
參考文獻[編輯]- ^ 1.01.1Overview of SNOMED
- ^ 2.02.1FAQs: Inclusion of SNOMED CT in the UMLS
- ^http://www.healthdatamanagement.com/html/PortalStory.cfm?type=newprodDID=7841
- ^ihtsdo.org -
- ^SNOMED Clinical Terms?? (SNOMED CT??)
參見[編輯]
- 國際衛生術語標準制定組織(International Health Terminology Standards Development Organization,IHTSDO)
- HL7
- CPT
- ICD-O
- UMLS
- LOINC
- MEDCIN
- 臨床數據交換標準協會(Clinical Data Interchange Standards Consortium,CDISC)
- DOCLE
外部鏈接[編輯]
- IHTSDO 網站 - SNOMED 所有者主頁
- www.snomed.org(正在搬遷)
- CAP SNOMED Terminology Solutions - SNOMED CT的原創者
- CliniClue SNOMED CT Browser - 免費軟體下載
- UMLS-SNOMED 常見問題解答
- NHS Connecting for Health UK
- SNOB - Desktop SNOMED Browser - 免費軟體下載
- SNOMED CT Browser with SNOFLAKE view at dataline.co.uk
- VMIL 術語瀏覽器
- SNOCat: SNOMED Categorizer/Browser
推薦閱讀:
※現在我國縣醫院連個肺炎都治不好?
※17歲的青少年患上慢性支氣管炎怎麼治療?
※如何評價問醫生這款 App?
※請尊重我們的勞動,拒絕免費醫療諮詢!
※被扣以「奉獻」高帽的醫務人員,正在困境中苦苦掙扎