你知道均值卻不知道什么是平均數(shù)
你知道均值卻不知道什么是平均數(shù)
那么你會用平均數(shù)嗎?平均、均值、平均數(shù)、平均值,average,mean等這些都是我們zui常用到的統(tǒng)計量,但是真正要會用平均,并且知道它的適用情景是非常重要的,甚至有時候是一種常識。
你知道均值,或許不知道什么是算術平均,幾何平均,其實還有調(diào)和平均,還有中位數(shù)Median和眾數(shù)Mode。
什么是平均?簡單思考的平均的意義的話,這是一種常識,似乎人人都在用平均。在數(shù)據(jù)分析的時候更是經(jīng)常用到平均,平均數(shù)。實際上平均具有多種含義的,其適用情景也依賴你研究的對象意義,且采用計算的方式和方法。
所以,平均就是一個數(shù)值,它應該能夠取代你所有數(shù)據(jù)中的每一個數(shù)據(jù)值,會得到同樣的結(jié)果;如果我把某個數(shù)值用平均值代替,是否是一個有“代表”的樣本,能夠得到同樣的意義解讀!
情景1:如果我講課有40個同學給老師講課滿意度進行評價,50%的人喜歡得1分,50%人不喜歡得-1分,平均值=0,什么意思?
情景2:我國房地產(chǎn)全國市場,上半年房價下降41%,而下半年上漲了44%,全年平均增長了1.5%嗎?
情景3:如果你開車上班,去時你以每小時30公里到單位,下班回程你以每小時60公里到家,那么你平均開車每小時45公里嗎?能說明你到單位的距離嗎?
看來是要仔細斟酌一下“平均”了!
算術平均:Arithmetic Mean
優(yōu)點:算術平均計算用到了所有數(shù)據(jù),計算相對簡單只需要加法和除法,平均結(jié)果直觀,zui能表達一種把取值大的和取值小的都拉到了平均的中間值,有回歸的意義;這也是我們在統(tǒng)計分析中zui常用的統(tǒng)計量;
缺點:算術平均容易受到異常值的影響,沒有了差異;太中庸了,強調(diào)了一般性、普遍性;
例如:在電梯里,你的體重是150斤,有個小孩體重是100斤,還有一個箱子是350斤,平均重量是[(150+100+350)/3]=200斤,大概沒有人會算出三個人的平均體重是200斤,只能說明電梯負重了多少,平均沒有任何意義,所有只能是同類數(shù)據(jù)可以算術平均;如果你把驢和馬的體重加在一起算平均,只能算出肉的意義;或許*的數(shù)據(jù)就是把別墅豪宅和保障性住房給加一起平均了;
當然,算術平均在80%的場合都適用,但偏偏就有20%的情景往往用算術平均不合適!因為,2/8原則提示20%的人占據(jù)著80%的社會財富!
比如收入,即使你的樣本量再大,只要比爾·蓋茨入樣,Average立刻發(fā)生改變!但對于體重和身高,即使有人需要用卡車拉出來,有人比姚明還高兩倍,只要樣本足夠大,Average也不發(fā)生改變!
中位數(shù) Median
中位數(shù)表述中間的意思,也就是通過計算中間值代表平均;例如一組排好序列的數(shù)據(jù):1,2 ,3 ,4其中位數(shù)=2.5,當然算術平均也是2.5;但是當數(shù)據(jù)呈現(xiàn)為:1,2,3,4,100時,平均值=22,但中位數(shù)=3(中間的值);顯然用中位數(shù)合理!
優(yōu)點:中位數(shù)對異常值不敏感,所以對于能夠成為分組數(shù)據(jù)的比較適用,因為中位數(shù)就將數(shù)據(jù)分成了兩個組;
缺點:中位數(shù)需要對數(shù)據(jù)進行排序,但大部分人在說中間數(shù)據(jù)時,別人會理解為平均;
例如:當我們說有一半的人生活水平在平均線以下,這個平均應該指的是中位數(shù),而不是平均值;所以房價、收入等價格問題不要用算術平均,中位數(shù)比較合適,否則我們都有了“被平均”的感覺!
眾數(shù) Mode
眾數(shù)就是zui多的、zui流行的意思;贏者勝出的度量,在大多數(shù)需要投票決定的情況下,選擇眾數(shù)比較理想;
優(yōu)點:容易計算,容易理解,zui多的數(shù)就是;經(jīng)常用在選擇和投票行為中,這種情況沒有人愿意選擇平均;
缺點:有時候沒有眾數(shù),有時候不止一個;眾數(shù)更像投票,舉手表決,而不是計算;有些情況下需要唱票,方式會復雜;當然贏者通吃情況下,沒有妥協(xié)和中間路線,多一票也是他了!
例如:大家生活工作中經(jīng)常碰到的少數(shù)服從多數(shù),就是眾數(shù)的理解;當我們要測量人們對那部電影的偏好或評選*演員時,眾數(shù)也是*選擇;你在選擇當今流行顏色的時候,顯然平均顏色沒有任何意義;
當然,如果北京市機動車限行日,如果一周7天,讓大家選擇一天限行(不考慮汽車尾號),應該選擇人們“投票”zui多的哪一天,而平均是沒有意義的。
到這里,留一個問題給大家:
1-北京市住房新政下,90平米是貸款利率的分界點,你認為如果進行調(diào)查,應該用哪個“平均”;
幾何平均 Geometric Mean
對于平均來講,大部分人,或者說大多數(shù)情況下,我們只要把數(shù)據(jù)加總求和,計算平均;但是當我們談論與投資、面積或體積、回報率、利潤率等要素的時候,往往采用把它們乘起來求平均的方法,這就是幾何平均。
比如有兩只基金投資組合,投資了四只股票,盈虧率情況如下:
組合方案A:+10%,-10%,10%,-10%
組合方案B:+30%,-30%,30%,-30%
如果讓你選擇一個基金,你認為那只基金盈虧比較平衡呢?顯然,如果我們采用算術平均,那么兩個組合盈虧都是0,甚至你會認為方案B更好些呢!符合掙得到,賠得多的風險投資理念。
但如果我們采用幾何平均進行計算:
組合方案A:1.10*0.90*1.10*0.90=0.98,開四次方,平均約有2%的虧損,平攤到每只股票是0.5%的虧損
組合方案B:1.30*0.70*1.30*0.70=0.83,開四次方,平均約有17%的虧損,平攤到每只股票是4.6%的虧損
現(xiàn)在大家可以看出來了,兩只基金投資組合都是虧損,但如果必須選一只基金的話,平均來講還是組合A比較穩(wěn)妥!
優(yōu)點:乘法原則,一損俱損(加法原則是取長補短);在綜合評價中,構成一組指標體系的子指標集的數(shù)據(jù),往往采用乘法;主要用在率,面積和體積,容量等
缺點:計算稍微復雜。
例如:
情景一:收視率分析,電視收視率,為了得到在同一起跑線上對收視率進行比較,需要用頻道、時段和類型進行收視率修正,就可以采用幾何平均;
情景二:通貨膨脹率計算,如果我們得到三年的通貨膨脹率是1%,2%和10%,那么平均通貨膨脹率=(1.01*1.02*1.10)^(1/3)=4.3%;
情景三:優(yōu)惠券,假如你得到三種折扣優(yōu)惠券,分別折扣是50%,25%,35%的off,那么當你全部用上購物的時候,你的平均折扣是多少?(0.50*0.75*0.65)^(1/3)=37.5%;
情景四:平均面積,如果你房子的客廳,面積是長15米,寬4米,那么平均長或?qū)捠嵌嗌伲?15*4)^(1/2)=7.75米
情景五:如果你有一個12*24*48公分的箱子,那么對應一個標準的立方體的平均是多少?(12*24*48)^(1/3)=24公分。
從上面我們可以看出,幾何平均適用于需要乘法計算的情況下,求平均的含義!
調(diào)和平均 Harmonic Mean調(diào)和平均大家可能用得比較少了,實際上調(diào)和平均zui重要的一點就是在完成一個任務時,也就是當我們要分成不同的步驟完成同一個目標時,如何計算平均率的含義!
前面我們在計算上班開車往返平均速度時,去程每小時30公里,回程每小時60公里,那么采用調(diào)和平均應該等于2/(1/30+1/60)=40公里/每小時。也就是說調(diào)和平均是計算平均率,等于=總產(chǎn)出/總投入!
優(yōu)點:調(diào)和平均適用于為得到同一個目標,對平均數(shù)起同等作用條件下應用,來計算平均率;有時候在不知道分子的情況下,采用調(diào)和平均計算;
缺點:計算復雜,取值不能有0值,也容易受異常值和值影響!
例如:如果你準備攢錢分期購買股票,但必須分三個月買股票,支付價格分別是:1月25元/股,2月30元/股,3月35元/股,那么你購買股票的平均價格是多少呢?調(diào)和平均=3/(1/25+1/30+1/35)=29.43元/股;
現(xiàn)在你如果手頭有1萬元或3萬元,你就可以計算平均來講能夠買多少股了。
當然,除了前面我們敘述的各種平均數(shù)計算方法,其實還有別的所謂平均,什么加權平均、預測值、回歸等都具有平均的意味!有時候,比較哪種平均方法誰好誰壞,是沒有意義的,關鍵看你掌握的數(shù)據(jù)和適用的條件。
記?。何覀冊谡務撈骄臅r候,其實一直不要忘了,前面有兩個前提:這就是分類和差異!離開了分類問題,差異問題談平均是沒有意義的,當然沒有平均我們就沒有辦法聊天了!
還有,談論平均都是假設我們討論的事物應該服從所謂正態(tài)分布,95%的情況;但是自然界中很多現(xiàn)象不一定服從正態(tài)分布,談論平均就沒有意義了,例如:冪律分布。
你知道均值卻不知道什么是平均數(shù)
免責聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-化工儀器網(wǎng)合法擁有版權或有權使用的作品,未經(jīng)本網(wǎng)授權不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關法律責任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。