數據新作為·數據30人20城系列報道解碼數治之道?
數字政府建設是推進治理能力現代化的重要支撐,是經濟社會高質量發展的必然選擇。而盤活數據資源是數字政府建設的關鍵之舉。南方都市報、南都大數據研究院推出系列專題,專訪數據開放實踐者、治理標準制定者、數據安全護航者、數據立法起草者等,并且挖掘數據應用創新舉措,探尋數治能力優秀區域,以“30人訪談為引,以20城案例為鑒”,致力呈現新時代下的“數據新作為”,共譜數智新篇。
同時,面向全國企事業單位、科研機構等征集數據應用優秀案例(資料或線索請發郵箱nandubdi@163.com),我們將組織大數據領域有關權威專家對案例進行解讀、評估,并進行更深入采訪,實現更廣泛推廣應用。
數據交易是數據要素市場建構的關鍵一環,而通過構建數據交易平臺的模式推動數據交易與數據流通,已經成為各地數據要素市場建設的重要政策。只是觀察現有各地的實踐探索,通過數據交易所進行的交易仍然面臨重重困難。數據交易能否超越基于數據的服務,成為基于數據產品本身的商品交易?如何培育多樣化數據供需市場以及交易場景?為此,南都大數據研究院數字政府研究中心專訪了武漢大學新聞與傳播學院副教授、武漢鏑次元數據科技有限公司創始人王瓊。
已進入更為精細化的數據產品交易階段
南都:目前數據交易迎來熱潮,據您了解國內數據交易市場發展現狀如何?主要有哪些類型?
王瓊:數據交易今天是一個熱詞,但并非新詞。2012年是中國大數據元年。2015年,以貴陽大數據交易所為代表的國家首批大數據交易中心開始出現,隨后出現了一些商業化的數據交易平臺,如京東萬象、聚合數據等。關于數據交易市場的分類,可以根據不同緯度,按主體屬性分,可以分為政府類、商業類;按照交易內容和方式可以分為原始數據類、統計數據類、數據服務類、API類等。
縱觀這10年來的數據交易情況,大體交易方式分為三個階段:其一,原始數據交易階段。當時數據交易的方式非常原始和粗放,例如,可以有郵寄硬盤、光盤的方式交易數據。主要問題在于數據可能存在質量低、安全風險、隱私風險、倫理風險等問題,且數據應用的技術成本很高,一般機構不一定有能力應用。
其二,數據接口交易階段。數據以API方式按需調取、付費。其優點是數據經過處理,質量與安全性都更高,但依然需要具備一定的技術能力才能應用。
其三,數據產品交易階段。我們認為當前中國的數據交易市場已經進入更為精細化的數據產品交易階段。數據可以被加工成能夠被普通個人應用的商品和服務形式,我們鏑數聚的產品理念也正是如此。既然數據是“石油”,數據時代的每一位公民都應該有機會參與、享有其紅利,應該讓獲取數據好像打開自來水龍頭一樣簡單輕松。
南都:政府類數據交易場所、數據服務商等數據交易平臺各有什么優勢?隨著數據應用更精細化,您認為哪些數據更符合市場需求?
王瓊:政府類數據交易場所的主要優勢包括:權威性、合規性的背書;大量獨家數據資源;市場化數據服務商主要優勢包括:更敏捷的基于用戶需求的產品化能力;更靈活的商業化做法。
我認為未來兩者將會形成配合。政府數據交易場所將會為數據流通市場帶來更多“原材料”,數據服務商可以基于這些原材料生產加工離用戶更近、更易用的數據商品,并形成更為豐富靈活的交易模式。
需要制定規則明確數據可交易內容邊界
南都:目前數據交易市場是需求大于供給,高質量數據主要集中在政府部門、頭部互聯網平臺以及金融機構等主體手里,如何培育多樣化的數據供需市場以及交易場景?
王瓊:數據質量的高低,應由“用戶”來定義,而不是供給方。因此,看起來連續性高、體量大、緯度豐富的數據,并不天然具備對于用戶的“高質量”。眾所周知,大數據都是高噪音的。未經脫敏、除噪、清洗等處理的數據,對于用戶來說不僅不是高質量數據,反而是危險的數據、麻煩的數據、無用的數據。
要培養多元化的數據供需市場、交易市場,首先需要制定規則,明確數據可交易的內容邊界,系統性防控因市場經濟行為引發的社會風險。其次,應充分激發市場主體的積極性,通過系列產業扶持政策與市場激勵的做法,鼓勵市場主體的豐富性、多元化,大力促進政企合作。最后,應通過一系列做法,由用戶需求驅動,深化數據應用的場景化、精細化發展。
南都:數據交易面臨哪些新難題?需要怎樣突破數據交易涉及的確權難、定價難、監管難等核心瓶頸?
王瓊:數據交易一直面臨安全性、倫理、知識產權等問題。如果交易的是原始數據(即便經過脫敏處理后的數據),其確權、定價、監管可能是短期內無法徹底解決的瓶頸問題,只能有待法律法規的逐步完善、技術手段的加強和市場供需的驅動。如果交易的不是原始數據,而是知識化、成果化的數據,也就是在合規的原始數據基礎上明確附加智力投入的,有著作權、知識產權的數據內容產品,則其定價、監管、確權的問題就相對明確。
提升數據供給質量需以用戶視角驅動
南都:數據交易關鍵是對數據質量的要求,國內數據交易平臺發展多年,但缺乏高質量的數據供給是重要拖累因素。您認為要如何提升數據供給的質量,有什么好建議?
王瓊:提升數據供給質量依然需要以用戶視角來驅動。不同交易平臺應有相對明確,最好是精準的用戶畫像。越貼近用戶需求的數據,對用戶來說質量越高。從數據底層來說,數據一手來源方應提高數據的數字化搜集、存儲、標簽化等處理過程以及處理結果的質量。近年來,我國不斷完善數據治理標準規范,出臺《政務信息資源共享管理暫行辦法》等政策提升政務數據質量,發布了國家標準《數據管理能力成熟度評估模型》,幫助企業評價、提升自身數據管理能力。這些都是在持續建設數據的底層能力。面向數據行業,應加強“可開放數據”的共享、合作、創新,鼓勵多方、多元深化合作;面向用戶側,應通過用戶調研充分了解用戶需求,分階段、分領域、分重點地進行數據產品化。
南都:作為數據服務商,如何利用多年沉淀的數據治理及數據服務能力,更深入賦能數字政府建設,助力城市數字化轉型?
王瓊:數據浩如煙海,每一家數據服務商都只能在有限領域發揮價值。近年來,在各垂類領域,國內外出現很多優秀垂類數據服務機構。以鏑數聚來說,鏑數是一個全行業數據內容平臺,雖然涉及16大類121個行業,但主要是經過脫敏加工處理后的數據,包括統計小數據、數據報告、數據圖表、數據集等,并不提供原始數據、API數據、輿情大數據、動態數據的服務。鏑數聚有數據來源8000多個,而跟我們類似海外數據平臺statista,數據來源超過2.5萬。這些數據源中除部分為各類開放數據平臺外,多數均為各領域專業數據服務機構。
因此,作為數據服務商能做的,也應做的是專注做好自己的產品,為用戶提供優質服務。同時,政府主導部門應充分鏈接、調用這些社會資源,為用戶提供“分布式”聯合服務。其背后邏輯是,用戶大量需求是復雜的、多層次的、并發的,不是任何單一平臺或機構有能力充分服務的;這些資源、服務需要協同和配置到用戶的生產生活中,這也不是任何單一主體能夠做到的。
個人簡介:
王瓊,武漢大學新聞與傳播學院副教授、武大鏑次元數據新聞研究中心主任、武大媒體發展研究中心研究員、武漢鏑次元數據科技有限公司創始人。珞珈青年學者,武漢大學青年學術研究團隊“中國數據新聞發展研究”帶頭人,TempleUniversity訪問學者。主要研究領域包括數據新聞、融媒體、視覺傳播等。曾獲2005年度“中國年度新聞評論節目主持人”稱號,谷歌全球數字媒體創新大賽亞洲區特別提名獎,“湖北省高校科技人員創新創業大賽”一等獎等。
出品:南都大數據研究院數字政府研究中心
統籌:鄒瑩研究員:袁炯賢設計:劉寅杉