第95個百分位(95th percentile)是什麼概念?
今天在看國外文章時見到專業術語:95th percentile,然後翻了下wikipedia,一頭霧水,英語不好的黯然淚下,求高人解答。
剛好今天下午需要用到這個概念,現學現賣,我說一下我的理解:
要明白第95百分位數就要理解什麼叫做百分位數。在說明百分位數概念的時候,先要說明一個前提,那就是我們的研究對象是一組數據。在一組數據所構成的樣本集合中,對於其中的一個樣本來說,小於這個樣本的值的樣本應該是整個樣本集合的一個子集,而且我們能夠計算出小於這個樣本值的樣本數量在整個樣本集合中佔到百分之多少,那麼這個樣本的值就是這個百分數所對應的百分位數。舉一個例子,小明在一次考試中得了50分,而全班有70%的同學的成績都小於50分,那麼對於由整個班級的考試成績所構成的一個樣本集合來說,第70百分位數等於50。百分位數的意義就在於,我們可以了解到某一個樣本在整個樣本集合中所處的位置或者某一個樣本組的值大概是怎麼樣分布的。
在計算百分位數的時候有這樣幾種方法:(1)最近序數方法(The Nearest Rank method)(2)在最近序數間線性插值的方法(The Linear Interpolation Between Closest Ranks method)(3)權重百分位數方法(The Weighted Percentile method)(4)微軟excel表格演算法(Microsoft Excel method)(5)NIST方法(NIST method)下面大家可以參考下, :the 95th-percentile ,
95th percentile百分點指的是所給數集中超過其95%的數。它是一個統計學上的概念。對於某個介面,準確統計它的流量時非常有用,它可以取出一些偶然得到的異常值。
95th百分點是統計時所採用的最高值,超過的5%的數據將被捨棄。這樣可以將瞬間的毛刺(尖峰)去掉,使統計平均更具真實意義。例如:
收集的數據為60,45,43,21,56,89,76,32,22,10,12,14,23,35,45,43,23,23,43,23 (20 個點)。將該序列降序排列,其最大值為89。由於20個點的5%為1,所以我們捨棄1個最大值89。剩下的最大值76就是我們所說的95th百分點
As far as i am concerned, the 95th-percentile should mean that it only need the highest 5% someone. As result, the others who are less than 5% (those 95%) will be useless.
In statistics, how to calculate the number what we want of the top 5%?First, a table is required containing group of number (same distance), number of counts, acuumulative counts, relatively accumulative counts which is a percentage number.
Second, the formular used here is: m=100-5=95, N is the number of population, L is the lower limit of the group where m is in, is the number of counts who are less than L,f is the number of counts of the group where m is in,i is the distance, every group should own the same value i.
Third, let"s take an example:
If i wanna take 95 percentile of this table, what is necessary is the counts number of group, the values of other groups can be caculated mannully.Now as we can see, the 95% is in the group [75~59], obviously.i equals "4"-"0"+1=5,so:use the formular:Is that clear?
Original works, all right reserved.百分位是用來定位的。管中窺豹,可見一斑。
如果知道某數在一個有序排列的集合中,處於什麼位置,我們就對整個數據集合就有了概念。
比如班裡有100個學生,某次考試成績出來,你拿到了85分,想知道自己處於班裡什麼水平,有沒有擠進前5%。
那就把大家的成績從低到高排列,排到你85分是在第95個,那恭喜,有95%的人都比你低。當然,也可以從高到低排列,反之亦然。
也就是說,如果我們知道了某個數據集合的95th percentile=X,那我們就可以知道有95%的數值都比它低或高。
怎麼算?
在實際應用中,數據不會這麼湊巧。
所以,要計算的話,我們需要先定位到這個百分位數是多少。
公式是:
Location=(n+1)*percentile
n為集合裡面的數據個數
舉例:
看到了吧。算出來如果是小數的話,要將第9個數和第10個數之間的差值繼續分割,進而定位到具體的數值。
怎麼用?
經常可以看到百分位數用在KPI考核上。
比如客服部門,按檔位算獎金。要保證至少一半的人能拿到獎金,而只有2%的人能夠拿到最高額的獎金。怎麼設計KPI呢?
就可以按照通話數量或者投訴率的百分位來設計。
將每月接通的電話數從低到高排列,50分位是1200通。也就是有一半的人都能達到。想要獎金,至少達到這個標準。
投訴率從高到低排列,98分位為5.44%,那就是說只有2%的人能將投訴率保持在5.44%以下。
(數字都是瞎舉的)
有幫助點個贊哦~~
95%percentile是一個值,按其大小,正好把樣本分成下95%和上5%。獲取這個值的最直觀的方法是,對樣本排序,從上往下數,正好數過5%時,對應的值就是。
考過GMAT的都因該知道吧 。比如考試分數顯示95th percentile,意思就是超過了該門考試統計人數的95%,意思就是排名前5%
汽車碰撞試驗中有用到95分位假人,95分位假人尺寸是188cm 108kg,意思是統計的人群中有百分之95的人體型小於這個尺寸。這個假人體型較高大
其他還有50百分位假人,體型中等,177cm 86kg,5百分位假人 148cm 56kg體型偏小。希望對你有幫助,這屬於人機工程學,汽車很多布局設計都要用到這種概念。因為汽車設計是要盡量滿足大部分人人群的需求。不能上傳照片!統計人體身高與人數關係,兩者大致是正態分布。比如橫坐標是150 155 160 165 170 175 180 185 190
然後將橫坐標平分10份,150對應10,155對應20。。以此類推,170對應的就是50,那麼在這次統計中,170身高就對應的50百分位。既然神飛哥在這裡也提問了,剛好看到,再把答案貼一下:一種常見的帶寬計費方式,按一定時間間隔對帶寬佔用進行取值,然後去掉最高的5%,剩下的帶寬佔用就都是要付費的。個人覺得那篇分析性能的文章里應該認為對於頁面性能來說這個值比較重要,直接影響到資金耗費。
A class of 20 students had the following scores on their most recent test: 75, 77, 78, 78, 80, 81, 81, 82, 83, 84, 84, 84, 85, 87, 87, 88, 88, 88, 89, 90. The score of 80 has four scores below it. Since 4/20 = 20%, 80 is the 20th percentile of the class. The score of 90 has 19 scores below it. Since 19/20 = 95%, 90 corresponds to the 95 percentile of the class.
我也來舉個栗子,在汽車設計中常用第95百分位或者第5百分位來定義某個國家標準低於該身高的所有人的身高,以第95百分位為例,表示在這個國家中95%的人的身高都低於該身高,這樣,評價車輛的空間就有了各國之間不同但是適合國情的標準……
95th Perc. 這個確實很難找。
個人理解就是中位數的演化版;
中位數是計算50%位置上的數是多少;
那麼95百分位數就是95%位置上的數是多少;
第90百分位數的計算 - CSDN博客 這個有實現過程
其實題主再仔細看下,就會發現維基百科有這樣一段話:
There is no standard definition of percentile, however all definitions yield similar results when the number of observations is very large and the probability distribution is continuous.
百分位沒有標準統一的定義,但是當樣本容量很大或概率分布是連續的時候,每種定義的結果都差不多。當樣本的一組觀測值是離散值時,最簡單就這樣算:先把這組樣本從小到大排序,然後最小的樣本個體下標計作1,依次類推,最大當然是N。ceil(P/100*N)得出第P個百分位的樣本個體下標,然後就能得到對應此下標的觀測值了。
了解了上述思路後,題主很容易就能得出下面例子的結論。
問汽車空調的那個嘛....哈哈哈 我也在找答案呢這邊有多少同行
A percentile (or a centile) is a measure used in statistics indicating the value below which a given percentage of observations in a group of observations fall. For example, the 95th percentile is the value (or score) below which 95 percent of the observations may be found.
沒想到 啊 沒想到 之乎上能找到答案
看了篇論文,看到的這個概念
推薦閱讀:
※最大似然法和貝葉斯的區別?
※什麼是無偏估計?
※扔一個六面的骰子,平均扔多少次能連續扔出三個相同的數字?
※概率論中的隨機遊走(Random Walk)中,怎麼理解最終行走距離的平方的期望等於步數?
※Data Scientist的日常工作作息是什麼樣的,這個工作女生能夠勝任么?