【摘要】在疫情之后全球和我國(guó)經(jīng)濟(jì)發(fā)展進(jìn)入數(shù)字經(jīng)濟(jì)新階段的背景下,另類數(shù)據(jù)的發(fā)展已經(jīng)在宏觀、中觀和微觀等應(yīng)用場(chǎng)景中得到了實(shí)際應(yīng)用。在宏觀方面,另類數(shù)據(jù)被用于編制物價(jià)、就業(yè)狀況、疫情復(fù)工等指數(shù),幫助我們更加清晰地認(rèn)識(shí)和分析經(jīng)濟(jì)形勢(shì);在中觀方面,另類數(shù)據(jù)通常用來(lái)整體分析企業(yè)經(jīng)營(yíng)情況、預(yù)測(cè)行業(yè)景氣程度等,跟蹤產(chǎn)業(yè)發(fā)展?fàn)顩r;在微觀方面,另類數(shù)據(jù)的應(yīng)用場(chǎng)景主要集中在投資決策輔助和個(gè)人信用判斷等。毋庸置疑,另類數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相互補(bǔ)充,將共同組成數(shù)字經(jīng)濟(jì)時(shí)代的生產(chǎn)要素,其行業(yè)本身也會(huì)成為經(jīng)濟(jì)增長(zhǎng)的新亮點(diǎn)。
【關(guān)鍵詞】另類數(shù)據(jù) 傳統(tǒng)數(shù)據(jù) 經(jīng)濟(jì)增長(zhǎng)
【中圖分類號(hào)】F49 【文獻(xiàn)標(biāo)識(shí)碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2021.06.003
廖理,清華大學(xué)五道口金融學(xué)院金融學(xué)講席教授、教育部長(zhǎng)江學(xué)者特聘教授、博導(dǎo)、清華大學(xué)五道口金融學(xué)院常務(wù)副院長(zhǎng)、清華大學(xué)金融科技研究院院長(zhǎng)、《清華金融評(píng)論》主編。研究方向?yàn)榻鹑诳萍?、公司金融。主要著作有《金融科技研究:前沿與探索》《全球互聯(lián)網(wǎng)金融商業(yè)模式》《股權(quán)分置改革與中國(guó)資本市場(chǎng)》等。
另類數(shù)據(jù)的應(yīng)用場(chǎng)景
本世紀(jì)初以來(lái),互聯(lián)網(wǎng)的普及,特別是移動(dòng)終端的普及,使得積累數(shù)據(jù)的基礎(chǔ)設(shè)施不斷加強(qiáng),以前無(wú)法留存的數(shù)據(jù)現(xiàn)在可以大規(guī)模的存儲(chǔ)和積累,并得到有效利用。與此同時(shí),數(shù)據(jù)存儲(chǔ)的材料不斷創(chuàng)新、技術(shù)不斷提高,數(shù)據(jù)存儲(chǔ)的成本也大幅降低,海量的數(shù)據(jù)也大大激發(fā)和帶動(dòng)了人工智能和云計(jì)算等技術(shù)的發(fā)展。
在這樣的背景下,另類數(shù)據(jù)的概念出現(xiàn)了。另類數(shù)據(jù),即非傳統(tǒng)數(shù)據(jù),目前尚未形成統(tǒng)一明確的定義,泛指區(qū)別于傳統(tǒng)金融數(shù)據(jù)的有價(jià)值的信息和數(shù)據(jù)。傳統(tǒng)金融數(shù)據(jù)是指通過(guò)常規(guī)渠道獲得的數(shù)據(jù),例如股票、債券等的交易數(shù)據(jù)、上市公司年報(bào)和財(cái)務(wù)數(shù)據(jù)、銀行用戶的借貸數(shù)據(jù)等。不同于傳統(tǒng)數(shù)據(jù),另類數(shù)據(jù)是典型的“大”數(shù)據(jù),主要體現(xiàn)在三個(gè)方面:一是體量大,體現(xiàn)在規(guī)模和傳輸量;二是流動(dòng)速度大,數(shù)據(jù)實(shí)時(shí)或接近實(shí)時(shí)獲取和傳輸;三是種類多,數(shù)據(jù)結(jié)構(gòu)形式多樣。
另類數(shù)據(jù)主要有三方面來(lái)源。一是個(gè)人產(chǎn)生的數(shù)據(jù),如社交網(wǎng)絡(luò)信息、產(chǎn)品評(píng)價(jià)、搜索記錄、購(gòu)物喜好等。二是商業(yè)過(guò)程數(shù)據(jù),如物流數(shù)據(jù)、支付數(shù)據(jù)等,也有另類數(shù)據(jù)公司采集傳統(tǒng)商業(yè)數(shù)據(jù),如大型百貨公司客流量、大型游樂(lè)場(chǎng)客流量等數(shù)據(jù)。三是傳感器數(shù)據(jù),如利用衛(wèi)星數(shù)據(jù)通過(guò)光感和熱感采集鋼廠、化工廠、原油等的開(kāi)工、采集、運(yùn)輸情況,另外,還有來(lái)自GPS定位、車(chē)輛軌跡和個(gè)人穿戴設(shè)備的另類數(shù)據(jù)。
海量的數(shù)據(jù)推動(dòng)了另類數(shù)據(jù)市場(chǎng)快速發(fā)展,另類數(shù)據(jù)公司大量涌現(xiàn)。從數(shù)據(jù)積累方面看,根據(jù)國(guó)際數(shù)據(jù)公司(International Data Corporation,簡(jiǎn)稱IDC)的一份報(bào)告,2018年全球有33ZB的數(shù)據(jù),而這個(gè)數(shù)量預(yù)計(jì)在2025年會(huì)增長(zhǎng)到175ZB。從另類數(shù)據(jù)公司數(shù)量上看,據(jù)AlternativeData的統(tǒng)計(jì)數(shù)據(jù),2018年全球另類數(shù)據(jù)公司已增長(zhǎng)到近400家,國(guó)內(nèi)另類數(shù)據(jù)公司大約占100家。我們估計(jì),目前中國(guó)已經(jīng)超過(guò)了200家。國(guó)際上的另類數(shù)據(jù)公司主要分為三類:一是原始數(shù)據(jù)提供者,這類供應(yīng)商只收集最原始的另類數(shù)據(jù),對(duì)于數(shù)據(jù)的處理程度最小;二是輕處理數(shù)據(jù)提供者,提供與金融資產(chǎn)相關(guān)的可視化數(shù)據(jù);三是信號(hào)提供者,一般專注于某個(gè)特定行業(yè),向資產(chǎn)管理公司提供打包好的量化投資信號(hào)。
從市場(chǎng)空間上看,AlternativeData統(tǒng)計(jì)表明,截至2017年全球已有約800支基金利用另類數(shù)據(jù)做投資決策,2017年投資機(jī)構(gòu)對(duì)另類數(shù)據(jù)的投入規(guī)模約為4億美金,行業(yè)正處于快速發(fā)展期。我們預(yù)計(jì)從2021年開(kāi)始到未來(lái)的10年期間,國(guó)內(nèi)每年新成立另類數(shù)據(jù)公司可達(dá)幾十家乃至100家,每年吸引投資達(dá)數(shù)十億人民幣。
疫情之后全球和我國(guó)經(jīng)濟(jì)發(fā)展進(jìn)入了一個(gè)新的階段,數(shù)字經(jīng)濟(jì)將成為我國(guó)經(jīng)濟(jì)下一個(gè)階段高質(zhì)量發(fā)展的重要特征。因此,就像金融行業(yè)助力實(shí)體經(jīng)濟(jì)發(fā)展一樣,另類數(shù)據(jù)行業(yè)不但會(huì)助力數(shù)字經(jīng)濟(jì)的發(fā)展,其行業(yè)本身也會(huì)成為經(jīng)濟(jì)增長(zhǎng)的新亮點(diǎn)。
從國(guó)內(nèi)發(fā)展的情況來(lái)看,另類數(shù)據(jù)已經(jīng)在宏觀、中觀和微觀等應(yīng)用場(chǎng)景中得到了實(shí)際應(yīng)用。在宏觀方面,另類數(shù)據(jù)被用于編制物價(jià)、就業(yè)狀況、疫情復(fù)工等指數(shù),幫助我們更加清晰地認(rèn)識(shí)和分析經(jīng)濟(jì)形勢(shì);在中觀方面,另類數(shù)據(jù)通常用來(lái)整體分析企業(yè)經(jīng)營(yíng)情況、預(yù)測(cè)行業(yè)景氣程度等,跟蹤產(chǎn)業(yè)發(fā)展?fàn)顩r;在微觀方面,另類數(shù)據(jù)的應(yīng)用場(chǎng)景主要集中在投資決策輔助和個(gè)人信用判斷等。毋庸置疑,另類數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相互補(bǔ)充,將共同組成數(shù)字經(jīng)濟(jì)時(shí)代的生產(chǎn)要素和支柱產(chǎn)業(yè)。
另類數(shù)據(jù)輔助經(jīng)濟(jì)發(fā)展形勢(shì)分析
另類數(shù)據(jù)可用來(lái)輔助預(yù)判經(jīng)濟(jì)發(fā)展形勢(shì),為政策制定者提供更多決策依據(jù)。例如,利用另類數(shù)據(jù)編制可實(shí)時(shí)更新經(jīng)濟(jì)指標(biāo)CPI,來(lái)作為傳統(tǒng)指數(shù)的有效補(bǔ)充;也可以用于編制就業(yè)指數(shù),提高就業(yè)指數(shù)底層數(shù)據(jù)的完整度和時(shí)效性。此外,另類數(shù)據(jù)也可為評(píng)估疫情等事件對(duì)經(jīng)濟(jì)發(fā)展的影響提供及時(shí)、全面、深入的底層數(shù)據(jù)依據(jù),以便得出準(zhǔn)確度高、顆粒度細(xì)的結(jié)論。
1.消費(fèi)者物價(jià)指數(shù):基于網(wǎng)絡(luò)消費(fèi)編制的數(shù)字經(jīng)濟(jì)指數(shù)。消費(fèi)者物價(jià)指數(shù)(Consumer Price Index,以下簡(jiǎn)稱CPI)是反映與居民生活有關(guān)的消費(fèi)品和服務(wù)價(jià)格水平變動(dòng)情況的重要宏觀指標(biāo),通常用來(lái)衡量通貨膨脹的水平。CPI是市場(chǎng)經(jīng)濟(jì)活動(dòng)與政府政策的一個(gè)重要參考指標(biāo),其變化會(huì)直接影響政府宏觀經(jīng)濟(jì)調(diào)控措施的出臺(tái)。傳統(tǒng)的CPI編制通常采用抽樣調(diào)查的方式選定代表性商品和價(jià)格調(diào)查地點(diǎn),并派調(diào)查員通過(guò)直接上門(mén)調(diào)查的方式收集計(jì)算CPI所需的原始價(jià)格資料,之后由國(guó)家統(tǒng)計(jì)局按人口和消費(fèi)水平加權(quán)匯總計(jì)算出CPI。隨著另類數(shù)據(jù)的積累,一些機(jī)構(gòu)開(kāi)始利用新的數(shù)據(jù)來(lái)補(bǔ)充傳統(tǒng)的CPI指標(biāo)。
Adobe公司推出了數(shù)字經(jīng)濟(jì)指數(shù)(Digital Economy Index,以下簡(jiǎn)稱DEI),該指數(shù)旨在衡量美國(guó)和全球主要經(jīng)濟(jì)體在數(shù)字經(jīng)濟(jì)中購(gòu)買(mǎi)的商品的通貨膨脹率。[1]該指數(shù)基于數(shù)字購(gòu)買(mǎi)力(Digital Purchasing Power,簡(jiǎn)稱DPP)計(jì)算,每月更新1次,以衡量1美元能夠購(gòu)買(mǎi)的商品。樣本規(guī)模為美國(guó)前100家網(wǎng)絡(luò)電商中的80家平臺(tái)的交易信息。DEI抽取了網(wǎng)絡(luò)電商中電子產(chǎn)品、食品雜貨、服裝、書(shū)籍、玩具等18個(gè)品類的價(jià)格指數(shù)進(jìn)行計(jì)算,其中食品雜貨、電子產(chǎn)品和服裝價(jià)格變動(dòng)對(duì)DEI影響最大。在指數(shù)計(jì)算過(guò)程中,覆蓋了超過(guò)1萬(wàn)億次的訪問(wèn)量和超過(guò)1億個(gè)庫(kù)存量單位(Stock Keeping Unit,簡(jiǎn)稱SKU)的數(shù)據(jù)信息。
目前,包括美國(guó)勞工統(tǒng)計(jì)局、美聯(lián)儲(chǔ)和美國(guó)人口普查局在內(nèi)的多個(gè)政府機(jī)構(gòu)和行業(yè)貿(mào)易組織都與Adobe開(kāi)展合作,以便即時(shí)了解數(shù)字經(jīng)濟(jì)的信息。和傳統(tǒng)基于調(diào)查的CPI統(tǒng)計(jì)口徑不同,DEI的數(shù)據(jù)是基于消費(fèi)者實(shí)際購(gòu)買(mǎi)的商品來(lái)實(shí)時(shí)計(jì)算的。另類數(shù)據(jù)的使用有效擴(kuò)大了樣本規(guī)模,降低了抽樣調(diào)查的成本。通過(guò)使用高頻率和廣覆蓋的互聯(lián)網(wǎng)電商購(gòu)物數(shù)據(jù),DEI指數(shù)可以幫助我們更方便地衡量數(shù)字經(jīng)濟(jì)環(huán)境下的物價(jià)指數(shù)和消費(fèi)者購(gòu)買(mǎi)力,能夠幫助消費(fèi)者、企業(yè)和政策制定者更加全面地了解經(jīng)濟(jì)情況。
2.失業(yè)率:基于網(wǎng)絡(luò)招聘數(shù)據(jù)編制的就業(yè)指數(shù)。就業(yè)穩(wěn)定是宏觀經(jīng)濟(jì)穩(wěn)定的重要內(nèi)容。失業(yè)率等反映就業(yè)市場(chǎng)狀況的指標(biāo)是宏觀經(jīng)濟(jì)的重要信息指標(biāo)和宏觀調(diào)控政策的實(shí)施依據(jù),直接關(guān)系到宏觀調(diào)控的政策應(yīng)對(duì)和未來(lái)經(jīng)濟(jì)的整體發(fā)展規(guī)劃。
在就業(yè)問(wèn)題的研究中,傳統(tǒng)就業(yè)指數(shù)主要包括登記失業(yè)率、調(diào)查失業(yè)率和求人倍率等,目前國(guó)內(nèi)外主要通過(guò)家庭抽樣調(diào)查和機(jī)構(gòu)抽樣調(diào)查兩種方式來(lái)統(tǒng)計(jì)相關(guān)人員的就業(yè)情況。與傳統(tǒng)就業(yè)調(diào)查數(shù)據(jù)相比,網(wǎng)絡(luò)招聘數(shù)據(jù)為就業(yè)問(wèn)題研究提供了更廣的覆蓋面和更強(qiáng)的時(shí)效性。
清華大學(xué)金融科技研究院與熵簡(jiǎn)科技公司聯(lián)合課題組通過(guò)對(duì)全網(wǎng)招聘大數(shù)據(jù)進(jìn)行結(jié)構(gòu)化清洗和聚合,編制了“基于網(wǎng)絡(luò)招聘數(shù)據(jù)的就業(yè)指數(shù)”,該指數(shù)實(shí)時(shí)捕捉了就業(yè)市場(chǎng)整體景氣度趨勢(shì)與結(jié)構(gòu)性變化,為基于就業(yè)數(shù)據(jù)的宏觀調(diào)控提供了補(bǔ)充參考。“基于網(wǎng)絡(luò)招聘數(shù)據(jù)的就業(yè)指數(shù)”分析了各大型招聘網(wǎng)站和各城市當(dāng)?shù)卣衅妇W(wǎng)站的招聘數(shù)據(jù),包括Boss直聘、前程無(wú)憂、智聯(lián)招聘、58同城、拉勾網(wǎng)等招聘網(wǎng)站的主要公司崗位數(shù)量、需求人數(shù)、崗位地點(diǎn)分布、崗位薪資分布、崗位學(xué)歷分布、崗位經(jīng)驗(yàn)分布、歷史崗位信息等。指數(shù)編制所使用的網(wǎng)絡(luò)招聘數(shù)據(jù)對(duì)我國(guó)就業(yè)市場(chǎng)的覆蓋率較高,可覆蓋除港澳臺(tái)之外的所有省市地區(qū),并覆蓋所有行業(yè)。
研究發(fā)現(xiàn),與官方統(tǒng)計(jì)數(shù)據(jù)對(duì)比,全國(guó)線上招聘需求數(shù)據(jù)與城鎮(zhèn)新增就業(yè)數(shù)據(jù)高度相關(guān),二者均存在很強(qiáng)的周期性特征。整體而言,“基于網(wǎng)絡(luò)招聘數(shù)據(jù)編制的就業(yè)指標(biāo)”可以反映我國(guó)就業(yè)市場(chǎng)景氣度,輔助對(duì)相關(guān)經(jīng)濟(jì)指標(biāo)的預(yù)測(cè),可以成為官方指標(biāo)的重要補(bǔ)充。
3.疫情后的經(jīng)濟(jì)分析:道口中小微經(jīng)濟(jì)恢復(fù)指數(shù)。新冠肺炎疫情為全球經(jīng)濟(jì)帶來(lái)了重創(chuàng),如何評(píng)估新冠肺炎疫情對(duì)經(jīng)濟(jì)和生產(chǎn)的影響、并制定相應(yīng)的應(yīng)急政策是各國(guó)各部門(mén)關(guān)注的重點(diǎn)。另類數(shù)據(jù)憑借其可獲取量高、實(shí)時(shí)性強(qiáng)的特征,在突發(fā)事件應(yīng)急中提供了重要支持作用。
2020年4月,清華大學(xué)五道口金融學(xué)院、道口金科聯(lián)合課題組聯(lián)合發(fā)布了“道口中小微經(jīng)濟(jì)恢復(fù)指數(shù)”。該指數(shù)旨在更深入、全面地了解全國(guó)各地企業(yè),尤其是中小微企業(yè)受疫情影響的具體狀況、經(jīng)濟(jì)活動(dòng)恢復(fù)情況、企業(yè)面臨的問(wèn)題、可能采取的行動(dòng)及對(duì)政策的訴求。課題組利用道口金科通過(guò)稅務(wù)、發(fā)票、支付、工商等多個(gè)數(shù)據(jù)源整理的企業(yè)經(jīng)營(yíng)類數(shù)據(jù),構(gòu)建全國(guó)、各行業(yè)、各地區(qū)及不同規(guī)模企業(yè)的“道口中小微經(jīng)濟(jì)恢復(fù)指數(shù)”,并從企業(yè)營(yíng)業(yè)收入入手研究此次疫情對(duì)我國(guó)經(jīng)濟(jì)的影響。經(jīng)研究,截至2020年3月31日,從全國(guó)來(lái)看,湖北省受到疫情沖擊最嚴(yán)重,恢復(fù)指數(shù)較低,大部分中小企業(yè)業(yè)務(wù)停擺狀態(tài)時(shí)間長(zhǎng);從行業(yè)來(lái)看,教育業(yè)、住宿及餐飲業(yè)、文娛產(chǎn)業(yè)受到?jīng)_擊影響最大;中小企業(yè)方面,微型企業(yè)恢復(fù)指數(shù)較高,說(shuō)明與2019年同期相比,微型企業(yè)經(jīng)濟(jì)活動(dòng)恢復(fù)水平高于小型和中型企業(yè)。
此指數(shù)背后的原始數(shù)據(jù)涵蓋了超過(guò)1年的日度頻率中小微企業(yè)營(yíng)業(yè)金額信息,包括1.73億條企業(yè)/日營(yíng)業(yè)記錄,7.84億條交易記錄;覆蓋了全國(guó)除港澳臺(tái)的31個(gè)省份和直轄市,對(duì)應(yīng)著全國(guó)600多個(gè)城市,同時(shí)也覆蓋了國(guó)家統(tǒng)計(jì)局的19個(gè)行業(yè)分類,具備數(shù)據(jù)量大、維度廣、顆粒度細(xì)的優(yōu)勢(shì),使研究人員在技術(shù)上可以對(duì)企業(yè)經(jīng)濟(jì)活動(dòng)恢復(fù)情況進(jìn)行更準(zhǔn)確、更多維的分析;企業(yè)經(jīng)營(yíng)數(shù)據(jù)可以更直觀、更完整地衡量企業(yè)經(jīng)營(yíng)情況,具備更顯著的經(jīng)濟(jì)意義。
除了能夠較準(zhǔn)確描摹企業(yè)經(jīng)濟(jì)恢復(fù)情況外,底層的企業(yè)經(jīng)營(yíng)類大數(shù)據(jù)還可用來(lái)量化測(cè)算疫情沖擊對(duì)于中小微企業(yè)收入的影響。課題組利用全國(guó)600多個(gè)城市2019年以來(lái)各行業(yè)的日度匯總數(shù)據(jù)進(jìn)行研究,建立了以企業(yè)營(yíng)業(yè)收入的自然對(duì)數(shù)為因變量的回歸模型,并通過(guò)將疫情設(shè)為一個(gè)虛擬變量來(lái)觀察疫情對(duì)企業(yè)營(yíng)收造成的影響?;貧w結(jié)果符合預(yù)期,截至2020年3月31日,新冠肺炎疫情沖擊在整體水平上會(huì)使得中小微企業(yè)收入降低69.5%;行業(yè)方面,住宿和餐飲行業(yè)、建筑業(yè)、教育業(yè)、房地產(chǎn)業(yè)、制造業(yè)、租賃和商業(yè)服務(wù)業(yè)的中小微企業(yè)收入受疫情的負(fù)面影響最大。
除了“道口中小微經(jīng)濟(jì)恢復(fù)指數(shù)”研究之外,其他研究者們也在利用各類另類數(shù)據(jù)從多方面評(píng)估新冠肺炎疫情帶來(lái)的沖擊。例如,通過(guò)利用夜間燈光監(jiān)測(cè)、遙感衛(wèi)星紅外成像輻射儀設(shè)備來(lái)判斷復(fù)工情況;利用城市出行數(shù)據(jù)、網(wǎng)絡(luò)輿情數(shù)據(jù)來(lái)判斷國(guó)家經(jīng)濟(jì)的恢復(fù)情況;利用支付寶旗下的“碼商”數(shù)據(jù)評(píng)估疫情對(duì)個(gè)體戶造成的影響;利用企業(yè)用電量情況估測(cè)企業(yè)復(fù)工指數(shù)等?;诹眍悢?shù)據(jù)構(gòu)建的實(shí)時(shí)性指標(biāo)都為我們分析疫情后的經(jīng)濟(jì)形勢(shì)提供了參考。
另類數(shù)據(jù)跟蹤產(chǎn)業(yè)發(fā)展?fàn)顩r
另類數(shù)據(jù)可以被用于跟蹤產(chǎn)業(yè)發(fā)展?fàn)顩r,例如,分析企業(yè)經(jīng)營(yíng)情況和預(yù)測(cè)行業(yè)景氣程度等。作為傳統(tǒng)經(jīng)營(yíng)數(shù)據(jù)的補(bǔ)充,另類數(shù)據(jù)具有高效、海量、客觀和實(shí)地等特征,能有效提高分析、預(yù)測(cè)的準(zhǔn)確性。
1.企業(yè)經(jīng)營(yíng)情況分析。不同于使用傳統(tǒng)的財(cái)務(wù)數(shù)據(jù)、經(jīng)營(yíng)數(shù)據(jù)來(lái)分析企業(yè)的經(jīng)營(yíng)情況。目前,大量機(jī)構(gòu)試圖通過(guò)收集衛(wèi)星遙感數(shù)據(jù)、航班數(shù)據(jù)、手機(jī)定位數(shù)據(jù)、氣象數(shù)據(jù)等另類數(shù)據(jù),結(jié)合深度學(xué)習(xí)等數(shù)據(jù)處理技術(shù),將過(guò)去無(wú)法獲取或者使用的數(shù)據(jù)轉(zhuǎn)化為準(zhǔn)確、高效的商業(yè)情報(bào)。
應(yīng)用一:企業(yè)開(kāi)工情況。望眼科技是國(guó)內(nèi)一家將衛(wèi)星遙感、氣象、無(wú)人機(jī)、物聯(lián)網(wǎng)、定位等時(shí)空數(shù)據(jù)用于商業(yè)分析的數(shù)據(jù)企業(yè)。望眼科技利用衛(wèi)星遙感數(shù)據(jù)繪制了夜光數(shù)據(jù)和溫度數(shù)據(jù),對(duì)企業(yè)開(kāi)工情況進(jìn)行實(shí)時(shí)掌控,降低造假風(fēng)險(xiǎn)。其中,夜光數(shù)據(jù)利用遙感衛(wèi)星獲取地面可見(jiàn)光情況,來(lái)分析地面人類活動(dòng)情況。在企業(yè)經(jīng)營(yíng)分析中,反映夜晚照明情況的夜光數(shù)據(jù)可以輔助追蹤企業(yè)的經(jīng)營(yíng)活動(dòng),企業(yè)夜光指數(shù)的增加通常反映了企業(yè)生產(chǎn)經(jīng)營(yíng)活動(dòng)的增加。溫度數(shù)據(jù)則利用傳感器收集物體發(fā)射的紅外能量,從而得到溫度信息。溫度指數(shù)通過(guò)監(jiān)測(cè)工廠內(nèi)的運(yùn)行溫度和周邊區(qū)域的溫度之差,來(lái)追蹤企業(yè)生產(chǎn)經(jīng)營(yíng)活動(dòng)。當(dāng)工廠內(nèi)的運(yùn)行溫度和周邊區(qū)域的溫度溫差增大時(shí),則說(shuō)明企業(yè)生產(chǎn)經(jīng)營(yíng)活動(dòng)有所增加。
應(yīng)用二:企業(yè)重大融資并購(gòu)情況。企業(yè)高管的行程能夠在一定層面上揭示公司的潛在決策。Paragon Intel是紐約一家通過(guò)搜集企業(yè)高管數(shù)據(jù)來(lái)監(jiān)測(cè)企業(yè)經(jīng)營(yíng)發(fā)展的數(shù)據(jù)企業(yè)。其主要通過(guò)監(jiān)控大企業(yè)高管的航班信息,來(lái)預(yù)測(cè)企業(yè)潛在重大交易、并購(gòu)的情況。在達(dá)成大筆交易之前,企業(yè)高管之間會(huì)頻繁會(huì)面。當(dāng)他們不在同一城市時(shí),高級(jí)管理人員通常乘坐公司飛機(jī)飛行至目的地,Paragon Intel實(shí)時(shí)監(jiān)控目標(biāo)企業(yè)相關(guān)的公務(wù)機(jī),獲得高管的出行數(shù)據(jù),這些航班累計(jì)覆蓋超過(guò)200萬(wàn)英里、10年時(shí)長(zhǎng)、25000個(gè)機(jī)場(chǎng)、1700架飛機(jī),遍及美洲、東歐和西歐、俄羅斯、中國(guó)沿海地區(qū)、亞洲其他地區(qū)以及北非部分地區(qū)。
2.行業(yè)發(fā)展指數(shù)。另類數(shù)據(jù)也被用于監(jiān)測(cè)相關(guān)行業(yè)的發(fā)展情況,以解決傳統(tǒng)財(cái)報(bào)數(shù)據(jù)滯后問(wèn)題、新興行業(yè)信息披露不足等問(wèn)題。
應(yīng)用一:社區(qū)團(tuán)購(gòu)行業(yè)。作為2020年的新型零售模式,社區(qū)團(tuán)購(gòu)受到了商業(yè)領(lǐng)域的極大關(guān)注。在社區(qū)團(tuán)購(gòu)中,社區(qū)居民通過(guò)平臺(tái)的微信小程序下單,平臺(tái)匯集社區(qū)居民的購(gòu)買(mǎi)信息再統(tǒng)一向供應(yīng)商采購(gòu),最后統(tǒng)一配送到社區(qū)自提點(diǎn)。百觀科技是國(guó)內(nèi)一家基于另類數(shù)據(jù)提供投研分析的數(shù)據(jù)平臺(tái)。該企業(yè)從2020年初開(kāi)始追蹤社區(qū)團(tuán)購(gòu)行業(yè)數(shù)據(jù),通過(guò)采集社區(qū)團(tuán)購(gòu)平臺(tái)的微信小程序,監(jiān)控近百萬(wàn)個(gè)自提點(diǎn)以及近十萬(wàn)個(gè)在售商品的銷(xiāo)量、價(jià)格和品類等數(shù)據(jù)。基于抓取的微信小程序數(shù)據(jù),可對(duì)社區(qū)團(tuán)購(gòu)行業(yè)的市場(chǎng)競(jìng)爭(zhēng)格局形成判斷,包括各平臺(tái)的地區(qū)分布、商品交易總額、商品品類分布、物流配送基礎(chǔ)設(shè)施搭建等情況。
應(yīng)用二:ESG行業(yè)。ESG,即環(huán)境、社會(huì)和公司治理(Environment; Social Responsibility; Corporate Governance)。Truvalue Lab是一家2013年成立于美國(guó)舊金山的ESG新型數(shù)據(jù)公司,其創(chuàng)始人Hendrik Bartel看到了ESG報(bào)告數(shù)據(jù)的局限性,決定利用AI技術(shù)從公開(kāi)信息中挖掘公司ESG的相關(guān)數(shù)據(jù)。Truvalue公司只會(huì)保留對(duì)公司可持續(xù)發(fā)展有實(shí)質(zhì)性影響的數(shù)據(jù),對(duì)其加以分析及量化,從而得到公司的ESG評(píng)分和趨勢(shì)變化。投資人不僅可以用其數(shù)據(jù)進(jìn)行投資決策,也可以通過(guò)ESG數(shù)據(jù)及時(shí)和被投資公司溝通交流。Truvalue公司也聯(lián)合指數(shù)基金機(jī)構(gòu)合作推出了ESG指數(shù)基金。Truvalue公司已于2020年10月被數(shù)據(jù)平臺(tái)FactSet收購(gòu)。
應(yīng)用三:線上消費(fèi)行業(yè)。國(guó)內(nèi)眾多另類數(shù)據(jù)公司通過(guò)抓取如天貓、京東等電商平臺(tái)的銷(xiāo)售數(shù)據(jù),如行業(yè)時(shí)序銷(xiāo)售數(shù)據(jù)、品牌時(shí)序銷(xiāo)售數(shù)據(jù)、店鋪銷(xiāo)售數(shù)據(jù)、熱銷(xiāo)商品榜單、品牌市占率、商品長(zhǎng)尾屬性構(gòu)成等信息,形成對(duì)大消費(fèi)行業(yè)的實(shí)時(shí)分析。對(duì)于在食品飲料、紡織服飾和家電等線上業(yè)務(wù)占比較高的行業(yè),企業(yè)的線上零售數(shù)據(jù)與財(cái)報(bào)的營(yíng)收數(shù)據(jù)呈現(xiàn)高度相關(guān)性,可通過(guò)線上電商零售數(shù)據(jù)實(shí)現(xiàn)對(duì)行業(yè)發(fā)展的實(shí)時(shí)監(jiān)控。
另類數(shù)據(jù)輔助投資決策和信用評(píng)估
另類數(shù)據(jù)也極大地輔助了個(gè)人的投資決策和信用評(píng)估。例如,個(gè)人在社交媒體和應(yīng)用上發(fā)布的事件信息,可以成為投資研究決策的補(bǔ)充信息;個(gè)人行為、生物特征等另類數(shù)據(jù)也可作為授信評(píng)估的輔助依據(jù),為信貸記錄缺失的用戶提供金融服務(wù)。
1.投資決策輔助。社交媒體平臺(tái)是如今人們獲取新聞和信息的重要來(lái)源之一。社交媒體平臺(tái)發(fā)布的最新消息往往比主流媒體的相關(guān)報(bào)道時(shí)效性更強(qiáng)、傳播速度更快、覆蓋范圍更廣。依靠傳統(tǒng)媒體的延遲報(bào)道或通過(guò)主流媒體渠道均存在一定的滯后性,在黑天鵝事件中往往會(huì)對(duì)投資決策帶來(lái)不利影響。因此,大量機(jī)構(gòu)通過(guò)社交媒體信息這一另類數(shù)據(jù)來(lái)輔助投資決策。
例如,Dataminr是一家美國(guó)的科技創(chuàng)業(yè)企業(yè),通過(guò)分析用戶在推特(Twitter)等社交媒體平臺(tái)上發(fā)布的信息,監(jiān)測(cè)影響力較大的事件或關(guān)鍵突發(fā)信息的最早跡象,并在事件擴(kuò)散或引起嚴(yán)重連鎖反應(yīng)前,提供實(shí)時(shí)報(bào)警服務(wù)以減少損失。2017年12月12日,奧地利一座大型天然氣設(shè)備發(fā)生爆炸,一位當(dāng)?shù)氐哪繐粽咴赥witter分享了一張實(shí)時(shí)火勢(shì)的照片。這一事件對(duì)股票和大宗商品交易有著重要影響,Dataminr在社交網(wǎng)絡(luò)上傳圖片的同時(shí),即刻向金融機(jī)構(gòu)客戶發(fā)出了預(yù)警,客戶在市場(chǎng)波動(dòng)前就已被提前告知這一突發(fā)事件,得以及時(shí)調(diào)整投資策略、避開(kāi)風(fēng)險(xiǎn)。這一突發(fā)事件直接影響了整個(gè)歐洲的天然氣供應(yīng),天然氣期貨價(jià)格飆升,整個(gè)能源行業(yè)也受到了沖擊。
2.信貸評(píng)估決策。金融機(jī)構(gòu)往往依據(jù)用戶的歷史信貸記錄來(lái)進(jìn)行授信決策。目前,以電信運(yùn)營(yíng)商數(shù)據(jù)、支付數(shù)據(jù)、航旅出行數(shù)據(jù)、申請(qǐng)行為數(shù)據(jù)等為代表另類數(shù)據(jù)被越來(lái)越多的用于信貸評(píng)估決策。
例如,新網(wǎng)銀行通過(guò)將另類數(shù)據(jù)應(yīng)用于貸款評(píng)分模型中,極大地提高了貸款效率。新網(wǎng)銀行在信貸評(píng)估時(shí),對(duì)用戶的電信運(yùn)營(yíng)商、社保公積金、航旅出行、學(xué)歷、支付行為、網(wǎng)絡(luò)購(gòu)物、地理位置、申請(qǐng)信息等數(shù)據(jù)進(jìn)行分析,也采集和使用了如用戶的圖片影像、生物特征、關(guān)聯(lián)網(wǎng)絡(luò)等數(shù)據(jù)來(lái)對(duì)客戶進(jìn)行精準(zhǔn)畫(huà)像和風(fēng)險(xiǎn)評(píng)估。而部分客戶雖銀行征信數(shù)據(jù)比較好,但存在多頭網(wǎng)絡(luò)借貸情況。新網(wǎng)銀行將這一部分另類數(shù)據(jù)也加入了評(píng)分模型,拒絕評(píng)分較低的風(fēng)險(xiǎn)客戶。
毋庸置疑,另類數(shù)據(jù)已經(jīng)成為新的生產(chǎn)要素,另類數(shù)據(jù)行業(yè)也逐漸成為數(shù)字經(jīng)濟(jì)時(shí)代的支柱產(chǎn)業(yè)。目前,從全球另類數(shù)據(jù)行業(yè)的發(fā)展來(lái)看,我國(guó)同其他國(guó)家處于一個(gè)起跑線上,并在應(yīng)用的很多領(lǐng)域處于領(lǐng)先地位,但是應(yīng)該指出的是,世界各國(guó)在發(fā)展另類數(shù)據(jù)行業(yè)方面都面臨著巨大的挑戰(zhàn),主要原因是尚未形成對(duì)另類數(shù)據(jù)行業(yè)進(jìn)行監(jiān)管的成熟框架。
數(shù)據(jù)的不當(dāng)獲取和使用,既能產(chǎn)生個(gè)人隱私和商業(yè)信息泄露的風(fēng)險(xiǎn),也能帶來(lái)國(guó)家安全層面的風(fēng)險(xiǎn),目前數(shù)據(jù)的獲取、加工、使用和交易等所有的環(huán)節(jié)都需要立法來(lái)規(guī)制。過(guò)去幾年,數(shù)據(jù)泄露和不當(dāng)使用的案件和案例不斷發(fā)生,暴露出另類數(shù)據(jù)行業(yè)監(jiān)管的空白。在我國(guó)邁向數(shù)字經(jīng)濟(jì)的征途中,如何既能發(fā)揮另類數(shù)據(jù)的巨大潛能,又能有效防范相關(guān)風(fēng)險(xiǎn),保障另類數(shù)據(jù)行業(yè)的健康發(fā)展,是擺在我們面前的一項(xiàng)重要任務(wù)。
注釋
[1]Adobe此前還曾推出過(guò)數(shù)字價(jià)格指數(shù)(Digital Price Index, DPI)、就業(yè)指數(shù)(Job Seeking Index, JSI)和數(shù)字房?jī)r(jià)指數(shù)(Digital Housing Index, DHI),但目前官網(wǎng)已不再更新這些指數(shù)。
責(zé) 編/張 曉
Alternative Data: A New Area of Economic Growth
Liao Li
Abstract: As the global and Chinese economic development is entering a new stage of digital economy thanks to the waning pandemic, the alternative data has been applied in macro, meso and micro scenarios. In the macro aspect, the alternative data is used to compile indices of price, employment situation and post-pandemic work resumption, in order to help us understand and analyze the economic reality more clearly; in the medium aspect, the alternative data is often used to analyze the overall operation situation of enterprises, predict the prospect of the industry, and follow up on the development of the industry; in the micro aspect, the application scenarios of the alternative data are mainly focused on investment decision support and personal credit judgment. There is no doubt that the alternative data and traditional data complement each other, which will constitute the factors of production in the digital economy era, and the industry itself will become a new highlight of economic growth.
Keywords: alternative data, traditional data, economic growth