國家統計局擬用大數據預測房?jì)r(jià)走勢 BAT不缺席
發(fā)布日期:2014/9/23 13:46:48 | 瀏覽次數:4101 來(lái)源:第一財經(jīng)日報國家統計局的“大數據夢(mèng)”肯定不是說(shuō)說(shuō)而已,而在這場(chǎng)圓夢(mèng)之旅中,作為中國互聯(lián)網(wǎng)翹楚的BAT(百度、阿里、騰訊)三家都不會(huì )缺席。
在19日上午召開(kāi)的第五屆中國統計開(kāi)放日上,國家統計局首次對外展示了其正在研究的基于百度搜索數據來(lái)預測房地產(chǎn)價(jià)格的新工具,并演示了這項工具對北京房?jì)r(jià)的驚人預測力。
在開(kāi)放日上,國家統計局也展示了新研發(fā)的網(wǎng)購數據統計,而其數據來(lái)源之一就是剛赴紐約上市的阿里巴巴。
騰訊也沒(méi)有缺席這場(chǎng)建立大數據統計的國家戰役。甫一開(kāi)年,國家統計局局長(cháng)馬建堂就馬不停蹄地走訪(fǎng)了中國最具代表性的互聯(lián)網(wǎng)企業(yè)。
馬建堂的身影出現在京東商城和阿里巴巴,以及1號店、CBI易貿集團、百度等企業(yè)。今年6月末,馬建堂來(lái)到了騰訊,并從馬化騰手中接過(guò)了一個(gè)企鵝公仔。
百度如何統計房?jì)r(jià)
更為精確的房地產(chǎn)價(jià)格統計一直是政府希圖攻克的難題。因為個(gè)人隱私、陰陽(yáng)合同等問(wèn)題存在可能影響源頭數據的真實(shí)性,而現有房地產(chǎn)領(lǐng)域“數出多門(mén)”的情況也增加了“數據打架”的概率。
相對而言,海量的搜索數據不經(jīng)意透露了真實(shí)的房地產(chǎn)走勢信息。
利用基于百度搜索數據,國家統計局篩選出同房地產(chǎn)價(jià)格有關(guān)的一系列關(guān)鍵詞,然后通過(guò)這些關(guān)鍵詞出現的時(shí)間頻次同以往實(shí)際發(fā)布的新房數據和二手房數據價(jià)格的走勢實(shí)施擬合并建立模型,最后根據所建模型預測未來(lái)房地產(chǎn)價(jià)格的走勢。
這就是國家統計局新工具的基本原理。除了國家統計局之外,美國的谷歌也是在用這種原理來(lái)預測流行病的暴發(fā)趨勢。
利用這一工具,國家統計局在開(kāi)放日現場(chǎng)演示了一把對北京房?jì)r(jià)的模擬和預測。
記者注意到,通過(guò)百度數據所得出的價(jià)格曲線(xiàn)預測值同實(shí)際價(jià)格曲線(xiàn)之間的擬合程度較高,其中百度搜索數據對二手房?jì)r(jià)格擬合效果比新房更好。這或許是因為剛需人群在尋找二手房交易時(shí)更能提供準確而真實(shí)的信息。
如果這項工具投入應用,官方內部有望提前多天就了解到下月房?jì)r(jià)的大致走勢。統計部門(mén)也希望,在房?jì)r(jià)實(shí)際數據出來(lái)后能使用這一工具檢驗官方數據的有效性,從而提升統計數據的有效性。
國家統計局同阿里巴巴的合作則由來(lái)已久。在向社會(huì )“找數據”的進(jìn)程中,淘寶網(wǎng)是統計部門(mén)最先關(guān)注的大數據來(lái)源。
因為淘寶網(wǎng)上的交易數據既是實(shí)時(shí)成交數,又真實(shí)有效,這正是統計部門(mén)以往驅動(dòng)龐大的調查隊伍所希望尋找的絕佳數據。
早在2012年,國家統計局上海調查總隊就開(kāi)始了網(wǎng)絡(luò )采價(jià)試點(diǎn)。上海調查總隊發(fā)現,淘寶網(wǎng)上有大量銷(xiāo)量較大但不在CPI統計內的產(chǎn)品,比如進(jìn)口糖果、進(jìn)口巧克力、進(jìn)口餅干、進(jìn)口奶粉、進(jìn)口美容用品和鮮花快遞等,通過(guò)一定的方式這些產(chǎn)品都可以被整合進(jìn)CPI。
另外,原有CPI規格品中有的數據比統計部門(mén)抽樣調查得到的數據更為及時(shí),比如書(shū)籍銷(xiāo)售價(jià)格就可以從亞馬遜、當當網(wǎng)、京東網(wǎng)上選取。上海的試點(diǎn)發(fā)現,2012年含網(wǎng)絡(luò )采價(jià)的CPI和不含網(wǎng)絡(luò )采價(jià)的CPI銜接性非常好。
統計局的互聯(lián)網(wǎng)思維
通過(guò)直接利用淘寶和天貓等電商交易平臺的數據,國家統計局就能統計出通過(guò)傳統調查無(wú)法拿到的網(wǎng)絡(luò )交易數據。
今年初,國家統計局開(kāi)始對外公布這一成果。數據顯示,上半年,全國網(wǎng)上零售額11375億元,同比增長(cháng)48.3%。
其中,限額以上單位網(wǎng)上零售額1819億元,增長(cháng)56.3%,而同期的社會(huì )消費品零售總額只有12.1%。如果沒(méi)有網(wǎng)上銷(xiāo)售數據,市場(chǎng)也許會(huì )過(guò)低估計中國經(jīng)濟增速放緩表象下的新經(jīng)濟動(dòng)力。
馬建堂在對騰訊調研時(shí)再次提出,要進(jìn)一步打造現代化服務(wù)型統計。積極利用互聯(lián)網(wǎng)和無(wú)線(xiàn)移動(dòng)等現代信息技術(shù)手段以及新興媒體等平臺不斷拓展統計服務(wù)渠道、提升服務(wù)品質(zhì)。
他表示,要特別加強與大型綜合性互聯(lián)網(wǎng)公司的合作,利用他們已有的各類(lèi)網(wǎng)絡(luò )平臺提供統計服務(wù),不斷推動(dòng)常規統計和各類(lèi)普查數據和產(chǎn)品展示的空間化、可視化,為社會(huì )公眾提供更加優(yōu)質(zhì)、友好的統計服務(wù)。
為了給公眾提供貼身服務(wù),就在這次統計開(kāi)放日上,國家統計局推出了更新版的國家數據庫手機軟件,向海外推出了具有可視化功能的英文版的國家數據庫,還展示了未來(lái)將要推出的應用第三次經(jīng)濟普查數據的地理信息系統。
利用這個(gè)地理信息系統,普通用戶(hù)能找到其自主劃定任意區域內的經(jīng)濟單位數量、分布和單位基本信息,同時(shí)還可以圖形化顯示一個(gè)地區內行業(yè)和企業(yè)數量的分布。
這就相當于一個(gè)商業(yè)的GPS導航,無(wú)論是規劃寫(xiě)字樓、建設百貨大樓、選定物流中心還是找到合作伙伴,都可以用這一GPS在商業(yè)的“地圖”上自由馳騁。
用馬建堂自己的話(huà)說(shuō),大數據時(shí)代正在來(lái)臨,“這一滾滾浪潮浩浩蕩蕩、不可阻擋”。
而在這場(chǎng)革新之潮中,馬建堂領(lǐng)導的國家統計局也在構筑一個(gè)“統計夢(mèng)”。在統計開(kāi)放日上,馬建堂用一個(gè)人的頭腦四肢比喻他的統計夢(mèng)想。
這個(gè)統計夢(mèng)有正確的頭腦,“真實(shí)可信、科學(xué)嚴謹、創(chuàng )新進(jìn)取、服務(wù)奉獻”的統計核心價(jià)值觀(guān)入腦入心,統領(lǐng)一切統計工作。
有健壯的兩臂,一邊插上現代信息技術(shù)的翅膀,實(shí)現統計生產(chǎn)全流程、全方位的信息化、網(wǎng)絡(luò )化、電子化,實(shí)現統計調查和大數據共同成為統計基礎數據兩大來(lái)源;
一邊是統計法制建設更加健全,依法統計、獨立調查蔚然成風(fēng)。有魁偉的軀干,統計生產(chǎn)流程再造,統計人員通過(guò)電子手段直接采集數據,調查對象利用互聯(lián)網(wǎng)直接上報數據,同一平臺加工處理所有統計數據。
有堅實(shí)的雙腿,就是統計基層工作得到進(jìn)一步加強,數據源頭更加透明;統計業(yè)務(wù)基礎更加鞏固,統計標準更加統一健全,統計制度更加規范完備,統計方法更加科學(xué)先進(jìn)。