「番外篇」 |「概念」和「概念體系」的意義、效率與局限
前言
剛入門開始學習經濟學的時候,帶我入門的學姐給我推薦了曼昆的書,之後,還提到了另外一位經濟學家,張五常,以及他的《經濟解釋》。她跟我說,「張的這套書很精彩,但被一些人稱為『離經叛道』的作品,不過建議你馬上找來看,等到你學過經典的教材,大概知道了『經』和『道』都是什麼了,可以拿出來看看」。
後來,我從曼昆的經濟學原理(微觀分冊)開始看,一路都只學了微觀部分,翻來覆去,終於在三年多以後,自以為大概知道了『經』和『道』都是什麼,買了一套《經濟解釋》,看後覺得獲益很多,也理解了學姐當初的心意。再後來,有朋友讓我幫忙推薦教材時,我會提到自己的這個故事。
如今再想,其實拋開書本以及數學模型,微經留下的其實就是那麼一些概念,以及概念之間的關係,或者說,是一套看問題的視角。它有兩個好:第一,概念和概念之間基本是「正交」的,用它來看問題,能拎得清;第二,解釋同樣的現象,這個體系用到的概念數量不多,是簡潔的。而經典教材中的經濟學理論,和《經濟解釋》中的理論,其實就是兩套有著不少交叉但也有關鍵不同的「概念體系」,它們各有各的適用之處。
如果用線性代數的角度來看,假設世界上全部的經濟現象可以抽象為N維空間中的一個點,每個維度就是導致現象發生的一個「因」。我們難以構建起全部N(一套完美精緻的理論),可以退而求其次,取其中最主要的「因」,降維,構成一套「基坐標系」,再用它來「定位(解釋)」現象。
從這個角度來看,經典教材中的經濟學理論和《經濟解釋》中的理論,其實就是而針對同樣的現象的集合,構建的不同的「基坐標系」。本文用了好多字,其實講的就是這樣一件事。
一、從「聚類」到概念及其效率
在《關於「同志騙婚」的探討》一文中,我曾舉過一個「驢」和「猴」的例子,在這裡重提並細化一下:
假設我們觀察到一群共100隻動物,其中50隻長得很像,體態較大,四蹄著地,黑短毛,長脖子長臉長耳朵;另外50隻長得也很像,體態小巧,時而直立時而四腳著地,金黃色短毛,能上樹,有的在吃桃子,紅屁股上有尾巴。這時,如果我們將每隻動物視為一個樣本點,並取其體重、毛色、臉長、耳朵長為四個變數用來刻畫,之後,將所有樣本點投影到由這四個變數為坐標軸的空間中,我們會發現,100隻動物會出現明顯的兩個「聚類」。那麼,面對這兩個聚類,我們給第一個聚類中所有動物起了一個共同的名字,叫「驢」,雖然它們任意兩隻都不完全一樣;我們又給第二個聚類中所有動物起了一個共同的名字,叫「猴」,雖然它們任意兩隻也都不完全一樣。
「驢」和「猴」兩個概念,就這樣產生了。關於這個過程,我們可以總結幾點:
第一,客觀的事實是一大群動物在形象上出現的聚類現象,「驢」和「猴」兩個概念並不存在,它們是被構造出來的。
第二,關於概念的構造,有三層效果。首先,概念起到了「區別」的作用——叫「驢」和「猴」還是叫「蘋果」和「橘子」並不重要,關鍵是叫兩個不同的名字;其次,概念的存在「簡化」了描述,方便了交流——從聚類到概念的過程,就好像統計中從樣本到均值的過程,概念或均值都只是樣本的「代表」,概念的「效率」取決於聚類有多明顯,或者說「代表性」有多強;最後,概念降低了認知成本,讓人有限的認知資源可以「產出」更多——比如在各種概念的基礎上探索/構造出更多概念及概念之間的關係。
第三,即便聚類現象再明顯,個體間的差異也依然存在,就像方差中的信息無法體現在均值中一樣,所以,使用概念時需要注意「表達精度」的要求。例如,「驢」這個概念對應整個物種,如果要具體到某頭驢,可能需要加上更多描述,比如「那頭馱著麻袋站在河邊的驢」,這樣才能達到足夠的「表達精度」。所以,概念雖然可以提高溝通的效率,但為了達到足夠的精度,還需要注意我們是要在什麼層面上進行描述。
二、概念體系的建立:主成分分析的啟發
如「驢」和「猴」這樣的概念,只是一個定義或描述,是獨立的。但如果概念構成體系,則可以實現「解釋現象」的目的。關於一個「概念體系」的形成,統計學依然能夠給我們一些啟發。
最早從模型的角度思考「概念體系」,是學統計學中「主成分分析」的時候。主成分分析告訴我們,在研究高維數據時,可以通過求樣本的主成分的方法,來實現對數據的「降維」處理,以簡化模型、更好地挖掘數據中的信息。當時不理解的有三點:
(1)什麼是「維」?
(2)為什麼要有「維」?
(3)為什麼要「降維」?
以「學生成績」這個樣本為例,假設樣本中每個樣品為一名學生的成績,用一個長度為9的向量代表,對應九門功課的分數,包括:語文、數學、外語、物理、化學、生物、政治、歷史、地理。顯然,對於這個樣本來說,每個「維度」,就是一門「科目」——換句話說,在統計學中,每個「維度」對應著一種「含義」,我們又叫它「變數」。
那麼,下一個問題就是,為什麼要有「變數/維」呢?
在我的理解中,「變數」有兩個功能:首先是「刻畫」——當我們要認識某樣事物時,總要通過找到一些「特點」來刻畫它,比如在上面的例子中,如果我們要認識的是學生的「學習水平」,選學生的成績作為「特點」,就比較合適。此外,在關心班級總體情況的同時,我們也會關心某個學生的情況,比如排在班級總體的什麼位置,跟其他同學成績差異怎樣,這便體現了「變數」的第二個功能:「區別」。
另一方面,「刻畫」和「區別」,既是變數的兩個功能,也是選擇變數的兩條原則:首先,選擇的變數要是研究目的/對象的較為直接的表現,其次,變數還要能夠體現出樣本中各樣品之間的差別。
以前面提到的問題為例:我們希望了解學生的學習水平,那麼,選擇各門功課的成績作為「變數」,顯然滿足了第一條原則「刻畫」。那如何理解第二條原則「區別」呢?這也帶來了第三個問題:為什麼要「降維」?
顯然,我們想要認識的對象「學習水平」,是一個「綜合的指標」,這使得用九門功課的成績來代表,一方面「不夠」,另一方面又「太多」。首先,說「不夠」是因為:從「刻畫」的角度來看,只用考試成績來代表其實是有遺漏的——比如,還應該考慮學生上課回答問題、課後作業的完成情況等等,此處是在盡量保證操作簡便的情況下,選了九門功課的成績來代表。其次,說「太多」是因為,從「區別」的角度來看,九門功課中,有的功課學生分數差異比較大,有的功課學生分數差異很小,對於「學習水平」這個綜合的指標來說,學生分數差異越大的功課,越能體現更多的信息,或者說,越能「說明問題」,也就有更有代表性。相反,如果一門功課學生分數差異很小,則這個變數包含的信息也就越少,亦即不那麼具有代表性。
事實上,當我們用很多變數來刻畫一組樣本時,因為變數之間互相交叉、重疊,彼此牽扯,會帶來「噪音」和「冗餘」,使我們真正關心的信息淹沒在數據中。所以,這裡的問題是:如何選擇用哪些變數來「刻畫」研究對象,以及,為了減少變數數目讓模型清晰、易於處理,我們該如何確定最具代表性的變數呢?而這就是「降維」的目的,「主成分分析」是一種基本的降維方法。
主成分分析方法認為,「噪音」和「冗餘」問題產生的根源,在於選擇的變數不合適。它給出了一個選擇變數的原則,即:所有樣本點在一個變數所代表的維度上「離散程度」越大,這個變數就越有效。然而,主成分分析的方法並非重新「篩選」一組變數,而是在原有數據的基礎上,用線性變換的方法,重新「構造」出一組滿足以上規則的變數,並按樣本的「離散程度」從大到小排序,依次稱為「第一主成分」、「第二主成分」、「第三主成分」……
經過主成分分析處理之後往往可以看到,只要保留最前面幾個主成分,就足以包含相當大比例的「信息」,在喪失非常有限的信息量的情況下,讓模型得到了相當大的簡化。
三、從概念體系的角度看學科
如果把統計學中的「變數」,對應到一般意義上的「概念」,那麼,主成分分析的方法,可以幫助我們理解一套概念體系的建立。其中包含的對應關係有:「變數」或「主成分」,就是概念體系中的概念;「樣本」,就是概念體系要描述或解釋的現象;「樣本在主成分上的離散程度」或「信息量」,就是概念的代表性或解釋力。
常見概念體系的典型代表是學科。以經濟學為例,其絕大多數內容都可以抽象為概念和概念之間的關係。在本公號之前發布的微觀講義第一講中,我先後介紹了「經濟」、「稀缺」、「價格機制」、「成本」、「收益」、「剩餘」等一系列概念,事實上,如果從概念體系的角度看經濟學這門學科,我們可以嘗試回答以下問題:經濟學中為什麼「產生」或者說「選擇」了這些概念,它們又為什麼沒有出現在其他學科比如物理、生物中?學科或者概念體系的建立,是否存在好/壞的標準,如果存在的話,它的標準是什麼?
首先,這些概念之所以產生於經濟學中,是因為經濟學專註於解釋的現象,在這些概念所代表的維度上離散程度最大,或者說,這些概念對於解釋經濟學所關注的對象來說最接近要害,最具有解釋力,以及顯然,物理、生物等其他學科關注的現象與經濟學不同,自然也就不會選擇這些概念了。其次,如果一門學科關注的所有現象視為一組樣本,那麼,從主成分分析的觀點來看,一套「好」的變數,應當是能夠以儘可能少的個數,解釋儘可能多的現象的——用儘可能少的主成分,來容納儘可能多的信息。
經濟學只是眾多學科中的一個例子,從概念體系的角度看各個學科,會發現它們一定程度上都存在上述特點。這裡可以用一個比喻來描述:不同學科關注的現象不同,每個學科就像一個「坐標系」一樣,精心選擇了儘可能少的軸,讓所有「樣本點(現象)儘可能離散開」,讓每個「點」(現象)在這個坐標系中找到自己的「位置」(解釋)。所以說,學習不同學科,實際上就是在建立自己的「坐標系倉庫」,以便看到更多、理解更多。
四、概念和概念體系的局限
概念的形成和概念體系的建立,極大降低了人們的認知成本,使得人們能夠描述、掌握、揭示更多的現象及其背後的規律。但同時,概念和概念體系也有著先天的信息缺失,或者說是一種「模糊性」,這種模糊性雖然是其效率的基礎,但也往往是其局限所在。
概念和概念體系的局限,可以概括為以下三個方面:
第一,跟「均值無法體現方差中的信息」一樣,概念凌駕於所有個體之上,用概念描述現象,或者用概念體系解釋現象時,難免因為信息缺失造成偏差,尤其是在用一個更宏觀的概念或概念體系,去描述或解釋更微觀的現象時。比如,一個社會宏觀層面上得到的規律,在解釋具體某個人的行為時,往往存在很大偏差。所以,在通過降維構建概念體系的過程中,具體降維到什麼程度,也取決於我們想在什麼層面上尋找規律。
第二,與描述和解釋相反的方向,是向內的對現象的判斷和理解。如果用一個更宏觀的概念或概念體系,去判斷或理解一個更微觀的現象,也容易陷入自以為是實際上謬以千里的狀態——對事件非黑即白的「降維打擊」,以及用貼標籤的方式認識一個人,都是典型的例子。
第三,除了概念和概念體系本身帶來的偏差,還有人在使用它們時帶來的偏差。這本質上也是概念的模糊性導致的,即對於不同人來說,同一個概念所指代的東西有所不同。對於不同類型的概念,這種差異的大小也不同:現實中有可見實體對應的概念差異小,比如蘋果、橘子、周杰倫等等;現實中沒有可見實體的抽象概念差異大,比如理性、善良、成功等等。
那麼,已知如上三方面的局限,我們該怎麼運用概念和概念體系?
第一,要弄清自己是要在什麼層面上描述或解釋現象,尋找精度合適的概念進行描述或構建體系。
第二,在用概念體系判斷或解釋現象的時候,要時刻提醒自己:概念體系是通過降維得到的,存在信息缺失,此外,構成概念體系的概念本身,還可能存在過於宏觀而精度不夠的問題。
第三,本文中一直在提概念體系,事實上在我的理解中,體系中的所有概念加上它們之間的邏輯關係,就是所謂的「理論」。理論看起來漂亮,但在具體情境中未必好用,它的實踐意義更多在於幫助我們在面對問題是迅速形成框架,找到關鍵,不至於犯方向性錯誤,它可以作為一個思考的起點或是參考系,等待豐富更多的細節。所以,要具體情況具體分析,注重細節,正所謂「細節決定成敗」。
五、總結
理解「概念」和「概念體系」是認識世界、尋找規律、明辨善惡的第一步,也是非常關鍵的一步,弄清並理解它們的效率與局限,可以幫助自己少走很多彎路。本文首先講述了「概念」的形成過程,說明了概念是對「聚類」的描述,降低了認知成本,提高了交流效率,但同時也先天地具有模糊性。之後,本文又借用主成分分析的思想,講述了概念體系的建立,並以經濟學為例,提出了一個粗略的評判概念體系優劣的角度。最後,本文強調了概念和概念體系的局限,並就如何運用總結了三點建議。
推薦閱讀:
※張兵:想讓你的身價暴漲100倍?你需要這個模型
※如何評價海老川兼武的機設?
※有哪些值得入手的高達模型,無論國產或者B社?
※我很喜歡做軍模但是因為預算問題不能購買正式一點的上色怎麼辦?
※對於如今的模型圈,現狀是神馬樣子的?