數據掐架,感受懸殊,數字“虛胖”之下
拿什么拯救“幸福的計算器”
在“GDP減速,幸福提速”呼聲漸高的當下,對每一個數字的解讀,都充滿著民意 的考量,以及對政績觀的反思!±兹说闹笖,孱弱的數字,其實總被利益堅冰包裹!√摷俚臄底中枰柟庀碌谋⿻瘢缤玖鲈谑中g臺上被解剖!》雌c這背后的情愫與動力,一切源自我們對真實性的敏感,對數字的潔癖。
被隨意撥弄的收視率—— 利益堅冰,陽光一曬就融化
纏繞在我們身邊的種種數據謎團,必須被推上手術臺來解剖。這背后的情愫與動力,源自我們對真實性的敏感,對數字的潔癖。
8月4日,倫敦奧運會賽場,多國羽毛球選手的“假球風波”尚未平息。就在這一天,萬里之外的中國,多家門戶網站分別以《當事人實述收視率黑幕:希望司法介入》和《收視率黑幕當事人:5000萬買前十,可定地區》為題,在版面醒目位置推出了揭露收視率黑幕的報道。
中視豐德影視版權有限公司董事長王建鋒8月1日在其微博上爆出一個驚人內幕:“自從我們與新疆衛視合作‘熱播劇場’后,就不斷有電視研究機構要與我們合作以推廣費換取收視率,而且免費讓你看到只要交錢就可以輕而易舉地獲得至少全國收視率前10強的數據!
自2010年《人民日報》帶頭揭露收視率數據作假后,有關“收視率數據存在重大問題”的聲音一直在業界流傳!爱斒氯送踅ㄤh講述收視率可以花錢買高的黑幕,希望司法介入。早該介入了!”央視名嘴崔永元對此事的鮮明觀點,再次觸及我們對身邊數據造假的憎惡感和所能承受的心理底線。
從各種見諸報端的數據,我們可以清晰地構筑起事件的發展脈絡——內地電視臺的收入70%以上來源于廣告,而整個電視行業將近一千億元的廣告投放則主要依據收視率。面對巨額的廣告誘惑,相對于競爭激烈的電視創新和靠內容來爭取高收視率,“做收視率”成為一種迅速上位的快捷方式。
從來不題字的國務院前總理朱镕基,曾破例給國家會計學院題過詞——“不做假賬”。這就是對底線的重申。被隨意撥弄的收視率,不經意間成為了利益天平上最溫順的那個砝碼。禁錮真實并觸碰了底線的利益堅冰,其實最害怕陽光下的暴曬。諸如收視率這樣纏繞在我們身邊的種種數據謎團,必須被推上手術臺來解剖。這背后的情愫與動力,源自我們對真實性的敏感,對數字的潔癖。
指數與政績相擁—— 虛榮之下,難斷的灰色鏈條
在“GDP減速,幸福提速”呼聲漸高的當下,對每一個數字的解讀,都充滿著民意的考量,以及對政績觀的反思。
在發達國家,哪個統計數據應該由哪個部門完成和發布,有著極為明確的規定,其他部門不能超越職權范圍發布統計數據。但在國內我們卻看到,統計局、住建部、發改委、房管局、國土局等等部門,似乎都可以發布有關房價的統計數據,這種狀況導致有關部門爭搶統計話語權。
多年前,國家統計局、北京市建委先后發布了北京房價指標,同一個城市,同一時段,國家統計局顯示北京房價上漲7.3%,而北京市統計顯示漲幅為17.3%。這樣的情況也曾在廣州發生,國家發改委和廣州市針對房價得出了一漲一跌完全不同的結果。業內人士指出,差距如此之大,不僅在于統計方法和計算方式不同,更與部門利益密切相關,各個部門都希望自己提供的統計數據成為決策的參照,以引導有利于自己的政策出臺。談及指數“重災區”,GDP是道繞不過的坎。而不出乎公眾意料的是,今年一季度各地GDP匯總之和再次高出國家統計局公布的全國數據。根據國家統計局數據,一季度全國GDP總量為10.80萬億元,而據中國經濟網記者匯總各地數據得出的結果是11.28萬億元,兩者相差4800億元。
行政干預導致某些地方存在數據虛高現象。多年前,我們已經看到,在“唯GDP”的國情里,虛榮之下,難斷的灰色鏈條。而在“GDP減速,幸福提速”呼聲漸高的當下,對每一個數字的解讀,都充滿著民意的考量,以及對政績觀的反思。
種類繁雜的“中國式數據”,依舊大多出自各類行政色彩濃厚的部門。透過表面虛榮,公眾已踏上尋找幸福之路。而拋給數字制造者們的問題是,曾經孱弱的數字,又該怎樣如履薄冰地走過?
數據掐架,感受懸殊—— 統計呼喚回歸科學本位
“普查工作者并非居心叵測之徒,但并非所有的數據都產生于良好的環境,也并不是所有的數據都會附有對精確度的說明。”
2011年8月,鐵道部網站發布消息稱,截至當年7月31日,京滬高鐵運營一個月以來,共開行動車組列車5542列,日均179列;運送旅客525.9萬人,日均17萬人,平均上座率107%。
網友“JungleGym”發微博稱,每次坐高鐵(次數不下50次)都有空座,滬寧高鐵也是周末高峰時段才會滿員。“我從未見過車廂里有站的乘客,不知107%數據從何而來?”
網友“來看看123”說,“看到這個消息著實讓我吃驚,不知道這個平均上座率是如何計算的?我在7月26日乘坐G124次列車時,二等座車廂里最多不會超過30%的座位上有人坐,一等座人更少,商務座只有3個座位有人!
湖北省統計局副局長葉青認為,鐵道部高鐵上座率算法有問題,其中有水分,不客觀。從經濟角度來講,其上座率與票款收入也不對稱。同樣,也會讓乘客產生誤解!107%的上座率聽上去挺唬人,但是實際上沒那么多人!
“普查工作者并非居心叵測之徒,但并非所有的數據都產生于良好的環境,也并不是所有的數據都會附有對精確度的說明!边@句話出自1954年出版的美國統計學家達菜爾·哈夫的名著《統計陷阱》。
將近六十年前出版的這本類似畫冊的教科書,有必要再拿來讓數據的“制造者”們重新溫習一遍。因為在“指數化時代”里,我們依舊在霧里看花。
1.5%VS25%。這是2010年3月,國家統計局和國土資源部在房價漲幅上的數據“掐架”。媒體評論員王攀曾對此解讀,任由數據打架最終會傷及統計部門的公信力。特別是在中國,統計還是一項權力,現實中存在著統計數據為政績服務——“數字出官、官出數字”。統計部門應當及時調整統計方法,而不是像有些地方統計官員所說的“目前統計體系是完美的,數據是真實可靠的”那樣,仍舊固守著目前備受質疑的統計體系。統計數據的誤差和扭曲,也并非一個概念。
北京工商大學經濟研究中心主任周清杰認為,指數發布的成熟和科學化需要多方努力,包括發布機構的運作更加規范,專業能力不斷提升;機構之間形成良性競爭,優勝劣汰;媒體更加理性,真正有自己的判斷,不跟風、不炒作、不曲解;政府加大官方相關數據發布的范圍,提升公信力。他還建議對指數發布采取一些“硬約束”,如相關行業主管部門、監管機構制定一些規則,規范相關指數的發布;建立、健全相關行業協會和執業資格制度,提高行業門檻等。
-一語點破
你所不知的 統計奧妙
-在國家統計局調查樣本中,自有住房戶比重超過80%,極易給人造成全國80%的人有房住的幻覺。但事實上,“自有住房率”原本的意義是有多大比例的房子是私有的。按照聯合國的統計資料,歐美發達和較發達國家的總自有住宅率普遍在60%至70%,中國在住房自有率上“超英趕美”,那是因為中國住房保障沒有跟上,這是危機,而不是成績。
-一般在統計上關心的兩種關系是因果和相關,前者例如缺水導致歉收,后者則相對復雜,比如身高越高體重相應越重,吃高脂肪食物越多,保持健康的幾率越小等等。
2011年第一季度,中國GDP 同比增長為9.7%,相比上年一季度11.9%的增速有所回落,就有分析認為,這是汽車和住房市場調控產生的影響,但其實經濟增速放緩與宏觀調控僅僅具有相關性,而不是絕對的因果。
-統計數字誤導最常見來自抽樣問題,首先要保證一定的樣本容量。樣本能很好的代表總體,避免調查受到社會傾向的影響,例如,恐怕很少有人愿意填寫問卷承認自己歧視農民工,但實際言行顯然是另一回事。
網上常見的所謂民意調查其結果是值得存疑,其原因就在于樣本構成大有問題。某網站將調查放出,最可能看到這個調查的是這個網站的?停荒承┰掝}更能引發人的興趣,有些則只是很少的人關心。這都會導致最終參加調查的人是一個有偏的樣本。結論代表了這些人群,卻不能推廣到全體。
-要特別注意平均數這個危險概念,這類計算方法總是容易受到極端數據的影響。
回憶一下小學時老師對一個差生拉下全班平均分的憤懣表情,以及一個月收入五萬的老板和五名月收入兩千元的員工“合力”享受著一萬元的月平均工資。研究表明,只有在處理一些呈現正態分布的形態特點的數據時,平均數才最有意義。
|