大數據定價方法的國內外研究綜述及對比分析
劉枬1, 郝雪鏡1, 陳俞宏2
1 重慶交通大學經濟與管理學院,重慶 400074
2 重慶市軌道交通(集團)有限公司,重慶 401120
摘要:大數據獨特的價值特徵導致數據定價問題複雜,儘管研究者對此展開了大量研究,但大多角度單一且缺乏實際應用性。鑑於此,對大數據定價方法進行了綜述,梳理出成本導向、市場導向、需求導向、利潤導向以及基於生命週期定價的5種定價類型,對比了成本法、協議定價、市場法、收益法、基於質量以及基於查詢的定價6種主流定價方法的優劣勢;最後通過大數據定價流程分析進一步展現了不同定價方法各自的特點,並對數據定價方向進行了展望,以期為今後的相關研究提供一定的參考。
關鍵詞: 大數據產品 ; 大數據資產 ; 數據定價 ; 定價模型 ; 定價策略
論文引用格式:
劉枬, 郝雪鏡, 陳俞宏. 大數據定價方法的國內外研究綜述及對比分析[J]. 大數據, 2021, 7(6): 89-102.
LIU N, HAO X J, CHEN Y H. A review and comparative analysis of domestic and foreign research on big data pricing methods[J]. Big Data Research, 2021, 7(6): 89-102.
1 引言
隨着人工智能、物聯網、雲計算等技術的發展,全球數據量正以指數型增長。據國際數據公司(IDC)預測,到2025年,全球數據量將增至175 ZB。與此同時,數據經濟應運而生,大數據正成為數據時代的重要財富。2011年,IDC和麥肯錫研究院對大數據的潛力和關鍵技術等進行了分析,指出數據為企業帶來決策價值,將成為企業的關鍵競爭力。數據價值在企業中直觀的體現是財務報表中日趨擴大的“賬面價值”和“市場價值”之間的差距,如Facebook首次公開募股時,實際估值高出報告的傳統資產(977億美元)的部分即為數據價值。對於此,Mayer-Schönberger V等人指出數據被納入資產負債表是必然的。為了釋放數據價值,美國政府2012年啓動“大數據研發計劃”,投資2億美元來改進從數據中獲取價值的能力。2015年我國國務院頒佈《促進大數據發展行動綱要》,將大數據戰略上升為國家戰略。2019年十九屆四中全會更是將數據列為一種生產要素。由此可見,大數據的發展勢不可擋,如何分析利用海量數據以創造價值成為社會各界關注的重點課題。
儘管數據量級巨大,但是目前對數據的使用卻極為有限。數據領域存在天然的割據和壟斷現象,“數據孤島”和供需錯配仍阻礙着數據價值的兑現。如Naisbitt J所言,數據是海量的,但真正有用的知識卻很匱乏。因此,亟待形成規範化的數據定價機制,以促進數據資源流通、合理分配以及數據價值釋放。而價格是由價值決定的,大數據價值具有密度低、不確定性和共享性等特點。大數據價值密度低體現在大數據中通常包含大量的無用內容,且數據價值隨着數據量的增加呈現邊際效用遞減甚至變為負增長,因此數據價值密度與數據量成反比。價值不確定性主要表現於3個方面。首先,大數據價值必須以數據的分析和處理為前提。其次,大數據價值具有雙向不確定性:一方面,數據成本信息僅由賣方掌握,交易信息不透明導致“檸檬市場”(信息不對稱下的好商品被淘汰、劣等品佔領市場,最後導致市場萎縮的情況);另一方面,數據價值取決於買方對數據的具體用途。最後,大數據價值難以從企業原有的產品和服務收益中單獨分割出來。此外,由於大數據所有權和使用權分離且邊際成本低,不同主體可共享同一份數據而不影響各自的效用,數據具有“共享品”屬性。這些獨特的價值特徵造成大數據定價的諸多困難。目前市場最普遍的是協議定價,即交易雙方通過反覆協商達成一致價格,如中關村數海大數據交易平台的買賣雙方自由定價,貴陽大數據交易所的平台撮合、買方定價。協議定價簡單可行,但交易效率低、信息嚴重不對稱,交易也多由賣方主導。因此,如何建立有效的數據定價方法,釋放數據價值,是亟待解決的問題。
2 國外數據定價方法研究現狀
大數據固定成本高且為沉沒成本,邊際成本趨近於零,導致傳統商品定價機制失效。眾多研究者對大數據定價進行了研究。國外研究成果主要分為大數據服務定價、大數據產品定價兩方面。
2.1 大數據服務定價
隨着人們對大數據概念的深入理解,數據即服務(data as a service,DaaS)被人們廣泛接受。數據被視作一種寶貴的資源,經分析處理後被提供給具有不同數據需求的系統及用户,帶來決策價值。基於此,一些企業開始轉型,開始發展數據分析服務的業務,數據市場逐漸發展起來。DaaS定價多是在實踐中發展起來的定價策略,主要分為以下3種類型。
● 公司訂閲是市場上最流行的定價模式,即提供商向商業組織收取訂閲費,提供指定時間段內和訂閲範圍內的數據服務產品。例如 ,數據公司AggData以固定價格銷售位置數據,但同時也以訂閲的形式為用户提供公司其他業務的數據 ;Datacoup通過收取每月費用來提供不同來源的數據,如Facebook、LinkedIn和Google等公司對用户在線賬户的訪問。這種定價模式類似捆綁定價,不是針對單一產品進行定價,而是將多個數據以打包的方式進行標價,從而以同質的數據在吸引更多用户的同時,獲取更高的利潤。但隨着客户需求的多樣化和複雜化,此方法將不可避免地出現數據資源浪費的情況 。
● 基於數據類型的定價是一種細粒度的定價模型,其按數據類型或自身屬性將DaaS定價層分開。例如微軟Azure為研究人員提供COVID-19研究數據集,美國國家海洋和大氣管理局(NOAA)為氣象學家提供不同價格的綜合地面數據等。此模型難點在於分類管理複雜,需要找到針對性的細分市場和客户,實施和推廣難度大。
● 基於容量的定價是基於提供的數據量進行分層定價的。該定價模式適用於數據使用量低的用户。例如,亞馬遜網絡服務/彈性計算雲(EC2)按傳輸量(以GB為單位)或每小時使用的隨機存取存儲器(RAM)收費;微軟Azure按小時收取處理能力費,按傳輸量收取存儲費。基於容量的定價有利於維護賣方利益,如通過雙重費率能保證供應商對成本的回收。此外,有研究顯示,按用量付費在壟斷條件下能產生更高的利潤。此方法的優勢在於容易實施,能避免對數據質量的直接量化。但如果邊際成本收斂到零,基於容量的方法將失去説服力,且該方法缺乏從需求角度對用户利益的考慮。
此外,Schomm F等人對數據市場上的數據服務提供商進行了調查,總結了一些定價模式,除上述提到的3種外,還有免費、統一費率、免費增值等模式。其中,免費模式通過提供免費數據吸引潛在客户,且較為靈活,但不具有營利性;統一費率模式則收取固定費用,允許用户在該時間段內無限制地使用服務,此方法交易成本低,但對於用户來説缺乏靈活性;免費增值模式通過免費的基礎服務吸引用户,再以收費的附加服務實現盈利。
2.2 大數據產品定價
隨着各行各業對數據需求的日益增長,越來越多的數據產品在網上交易,人們對數據的需求也越來越多樣化。數據市場活躍不僅能緩解“數據孤島”現象,還能發揮規模經濟效應,釋放更大的價值。在DaaS定價的基礎上,研究者提出了一些新興的數據產品定價方法,分為以下兩大類。
(1)基於版本的定價
基於版本的定價是基於數據壟斷者實施的價格歧視策略,營利性和交易效率較高。數據產品版本的劃分依據可以是數據特徵或用户需求,兩者均能實現市場細分、增加利潤。如廣聯達科技股份有限公司將其推行的軟件劃分為低價的學習版和高價的專業版,這便是對不同用户羣體實施的價格歧視策略。此外,數據的低複製成本和買方異質性使得捆綁定價應用普遍,如將不同數據質量的商品進行捆綁,以獲取更高的利潤。為了實現進一步的市場細分,Balazinska M等人將數據版本看作視圖,按用户選擇的任意組合的視圖來分配一個價格。此後,Koutris P等人將基於版本的定價進行了擴展,提出了基於查詢的定價模式,通過預設視圖價格實現了對買方任意查詢的自動定價,避免了套利和折扣。Li C等人進一步提出線性聚合交互式查詢定價模式,該模式滿足無套利、非披露、無後悔3個屬性。為了突破上述基於查詢的定價中只能通過預定義視圖查詢數據這一限制,Li C等人開發了一個基於擾動查詢的定價模型,並建立了更加靈活的無套利定價函數。而TANG R M等人則為元組設定價格,由元組生成滿足用户查詢最小的視圖,從而為任意查詢定價。但此改進後的基於查詢的定價仍存在諸多障礙。首先,單個元組本身幾乎無價值,以此組合而成的數據價格無説服力;其次,如何選擇視圖並對其進行定價缺乏明確的方法,從而造成實際操作中的障礙;最後,該模型是離線交易模型,而數據的更新是迅速的,預設價格視圖無法覆蓋新生成的數據。
(2)基於效用的定價
基於效用的定價即基於數據自身屬性和效用對其進行定價。前文定價多由賣方主導,強調供應商的利潤,缺乏對數據效用的考慮。鑑於此,Heckman J R等人和Harmon R等人分別基於數據的內在價值和客户感知價值建立了數據定價模型,均強調了定價時對用户利益的考慮。Liang F等人指出基於客户支付意願的定價有利於供應商更長遠的利益,關鍵在於如何對此意願進行量化。而數據質量的高低通常決定了用户的支付意願,因此質量因素常被用作數據效用的度量標準。數據質量維度之間存在線性和集成兩種關係,線性關係表示各質量維度對數據質量的獨立影響,集成關係表示數據質量維度之間的相互影響。基於數據質量的定價考慮了數據本身的價值和消費者效用,公平且透明,但仍然存在一些不足。首先,它只考慮了質量因素,忽略了數據容量等其他重要因素;其次,數據質量維度及維度之間的關係是難以量化的。
3 國內數據定價方法研究現狀
2012年李國傑等人率先指出了大數據對未來發展的重大意義。大數據價值引起了各行各業的重視,數據交易和數據定價成為研究熱點。而數據價值化是按照資源化、資產化、資本化3個進程推進的。本文從數據產品定價和數據資產定價兩方面進行總結。
3.1 數據產品定價
王文平梳理了數據產品的標準化和確權問題,並整理出平台預訂價、固定定價、協議定價、實時定價以及拍賣定價5種常用的定價模式。陳筱貞研究了數據交易的市場類型和定價,提出生成級別、信息領域以及應用端用途3類數據價格決定因素。趙子瑞指出當前定價策略中缺乏對數據成本的考慮,構建了基於成本論的大數據價格指標體系。胡燕玲認為數據定價的難點在於其價值不確定性,並提出大數據預處理定價策略。在以上研究的基礎上,數據產品定價研究取得了不少成果。
(1)基於生命週期理論的定價
數據的價值是隨時間波動的。閔華鬆等人最早提出數據的生命週期管理概念,構建了一個動態價值評估模型。王衞等人分析了數據產品的生命週期價值特徵,對數據進行了分階段定價。基於生命週期理論的定價靈活性高,且能提高數據資源的利用效率和社會總體效益。但在實踐中操作複雜,技術要求和實施成本較高。
(2)基於效用的定價
由於使用者對數據價值具有決定性作用,效用價格論應用廣泛。劉朝陽以成本價格和效用價格為上下限,在區間內通過定價策略來確定最終價格。熊勵等人指出基於用户感知價值的定價有利於滿足用户的個性化需求。李貴孚等人構建了信息商品的價格特徵模型,得到了使廠商利潤和消費者效用同時最大化的最優價格。孫玲芳等人提出將用户效用納入企業目標函數,並立足於客户的版本偏好進行動態定價。繆方瑜指出了消費者效用的影響因素,構建了定價函數。由於傳統的基於效用的定價多依賴於線性效用函數這一假設,而現實中,消費者的邊際支付意願通常是遞減的。因此,周木生等人提出了非線性支付意願假設,並基於此構建了更具普適性的定價模型。此外,韓海庭等人指出數據的價值在於其減少不確定性的決策效用,以“信息熵”進行了數據定價。基於效用的定價常以數據本身的特徵、質量以及客户感知價值為定價基礎,兼顧了數據本身的價值和消費者需求。如貴陽大數據交易所就將數據質量作為價格的決定性因素,數據質量包括數據品種、時間跨度、數據深度、數據完整性、數據覆蓋性和數據時效性6類。然而,在實踐中,由於大數據效用的預先客觀量化是十分困難的,此定價方法有待進一步的研究。
(3)基於博弈論的協議定價
數據的共享性允許交易雙方以協議定價的方式促進成交量,這是目前應用最廣泛的數據定價方法。劉洪玉等人考慮了成本價格、商品特性以及買方價格承受能力等因素,建立了魯賓斯坦模型用於數據定價。張曉玉給出了交易平台、買方、賣方三方的靜態博弈過程,構建了討價還價模型,得到了數據均衡價格。趙森在用成本法和收益法得到的價格區間內,通過“一對一”討價還價模型進行定價。陳俞宏建立了基於機器學習的效用函數,用斯坦伯格博弈模型實現大數據定 價。此外,汪靖偉等人指出,藉助區塊鏈技術能實現數據市場的去中心化,減少第三方干預,實現買賣雙方直接交易,有助於協議定價的進一步發展。可以看出,協議定價方法的目標性和數據的針對性較強,溝通機會多,成交率高。但協議定價方法也存在一些弊端,首先,數據交易雙方漫長的博弈過程會增加時間成本,降低交易效率,如武漢長江大數據交易所通常需要長達數月的時間才能撮合一個交易,交易的時間成本極高;其次,數據領域的壟斷性導致賣方主導,忽視了數據的真實效用;最後,信息不對稱導致數據的真實價值難以評估,價格偏差會引發非法套利。另外,拍賣的定價策略能同時兼顧賣方利潤和市場原則,常用於不能進行廣泛傳播或買家想獲取一定獨佔性的大數據產品,實施此模式的有貴陽大數據交易所等。基於此,陳志注等人修改了傳統Vickrey拍賣模型和序貫拍賣定價模型,能在確定拍賣數量的同時實現收益最大化。
(4)捆綁定價
數據產品的低邊際成本使得捆綁定價成為常用的銷售策略,作為版本定價的一種特殊形式,其包括純捆綁、不捆綁、混合捆綁3種類型。如杭州錢塘大數據交易中心和數據堂等藉助定製化或半定製化的數據交易模式,將多種互補或相互關聯的數據產品進行打包出售,以降低用户支付意願的分散度,獲得更多用户剩餘,佔有更多市場份額。但此方法可能導致用户購入不需要的數據,損害消費者利益。
3.2 數據資產定價
數據資產現已成為企業的重要資產。其與無形資產有許多相似特性,如無實物形態、價值不確定性、時效性、非競爭性等,因此,一些學者主張將成本法、收益法和市場法等無形資產評估方法沿用到數據資產中。
(1)成本法
在無形資產的評估中,成本 法是反映企業經濟效益的最基本方法。其以生產費用價值論為理論基礎,將數據資產的重置成本作為其價值計量基礎,適用於市場不活躍的情況。劉玉對數據的無形資產屬性進行了確認,認為對於企業外購和主動獲取的數據資產,應將成本法作為會計計量。成本法雖簡單易操作,但存在許多侷限。首先,數據邊際成本趨近於零,且高固定成本難以實現單位產品均攤,數據成本量化難;其次,數據成本與價值之間的對應關係弱,僅靠成本並不能衡量其獲益能力,成本法估值偏低;最後,由於數據獨特的生產過程,數據資產不存在平均化的社會必要勞動時間,衡量數據價值不能僅考慮成本而忽視具體使用情境。此外,也有研究指出,數據資產難以計量的功能性貶值也是成本法的應用障礙之一。
(2)收益法
由於數據資產不具有物理功能,其價值取決於其帶來的收益。收益法是評估大數據資產價值的首要方法,以效用價值論為理論基礎,將待估數據資產的預期收益現值作為價值計量。此方法的前提是已知數據預期收益、折現率和效益期限,這也是該方法的障礙所在。首先,由於數據價值的不確定性,數據的效益依賴於數據處理技術等具體條件,預期收益難以量化;其次,信息不對稱導致數據難以得到不同主體都認可的合理價值,評估主觀性較大;最後,折現率的確定難度大。鑑於此,目前多數企業將數據使用熱度作為收益的計量維度,具體指標有數據使用次數、調用頻數等。
(3)市場法
市場法從市場獲取指標,考慮了市場供求,更具客觀性和公平性。以均衡價格論為理論基礎,參照市場上類似數據交易案例的價格,利用技術水平、價值密度、評估日期、數據容量等可比因素進行修正,以得到待估資產價格。隨着數據市場的日趨活躍,市場法更具適用性。但目前市場法仍然存在諸多挑戰。首先,我國的數據交易尚處初期實踐中,市場不成熟,交易案例少,且案例多為協議定價,主觀性強,參考性低;其次,大數據產品個性化程度高,難以尋找具有相似特性的交易案例;最後,修正係數確定困難,某些修正項(如數據質量)難以量化,且難以確保數據差異修正全面。
(4)實物期權法
實物期權法適用於不確定性較大的無形資產,本質是對資產生命週期內的潛在價值進行動態評估。鑑於此,翟麗麗等人建立了數據資產的B-S期權定價模型。但由於數據資產本身成本特殊、風險高、價值不確定等特點,期權模型並不完全適用於數據資產評估。
鑑於單一方法難以量化數據價值因 素,戴炳榮等人指出應在無形資產評估方法的基礎上,考慮數據的價值密度、應用場景等因素,制定綜合定價方法。針對這個方面,黃樂等人對成本法、市場法以及收益法的結合應用進行了初步嘗試。此外,考慮到數據資產本身的價值特徵,一些研究者指出數據資產的評估應體現其特殊性,需設置單獨的“數據資產”會計計量科目和專門的數據資產評估模型。因此,張志剛等人指出數據資產價值取決於其成本和應用,利用層次分析法構建價值評估模型。王建伯則通過構建神經網絡得到反映實際數據資產應用價值的客觀價格。
4 國內外數據定價方法總結及對比
大數據定價這一研究領域由於研究時間較短,研究體系尚不完整。但隨着研究的不斷開展,也呈現出比較豐富的研究成果。從上述對國內外相關研究的梳理可以看出,按照對數據屬性的界定,大數據定價客體可被劃分為數據服務、數據產品以及數據資產3類。而定價方法上,以導向型定價法為理論基礎,大數據定價主要被劃分為成本導向、顧客導向、市場導向、利潤導向、基於生命週期5種定價類型。
● 成本導向型:以成本為依據,將成本補償放在首位的定價方式,多由賣方主導。包括大多數據服務定價,如固定費率、基於容量的定價、免費增值等;國內數據資產中的成本法等。目前較為主流的是國內的數據資產成本法。
● 顧客導向型:以價值為基礎,將消費者對產品價值的理解和需求強度作為定價依據,強調從需求端考慮用户效用,如國內外數據產品中基於效用的定價和國內數據資產中的收益法。關於基於效用的定價,國外文獻多從數據本身屬性出發,常將數據質量作為衡量用户支付意願和數據效用的指標,且能夠實現量化;而國內則更加註重用户對數據價值的決定作用,研究客户的感知價值,且大多在定性層面。此類型中國內研究較多的是數據資產中的收益法,而較先進的是國外基於質量的定價。
● 市場導向型:以市場上相互競爭的同類型商品價格為定價依據,考慮市場供求狀況,在較成熟和活躍的交易市場中具有較強的適用性。國內數據產品中基於博弈論的協議定價和數據資產中的市場法定價屬於 此類型。
● 利潤導向型:以企業自身利潤最大化為目標進行定價。在大數據定價中主要表現為數據壟斷者針對客户偏好和支付意願實施的差異化定價,最大限度榨取消費者剩餘的價值,如國外數據產品中的版本定價中基於查詢的定價,將同質的數據產品針對不同消費者制定不同的價格。這很容易引起“大數據殺熟”的問題,在這裏不做闡述。
● 基於生命週期:根據數據在生命週期內的不同特點進行動態定價,如國內數據產品中的生命週期分階段定價、數據資產中的實物期權法等。由於數據本身的價值隨着時間會呈現較大的波動,動態定價法具有重大意義。
數據定 價方法分類見表1。
目前具有代表性的較主流的方法有成本法、協議定價、市場法、收益法、基於質量的定價方法以及基於查詢的定價方法6種,下面對這些方法進行對比分析,見表2。
前文對數據定價方法進行了對比,為今後合理地制定數據價格指明瞭思路和方向。為了更好地展現不同定價方法在不同視角下具有的特點及優勢,下面 根據前述定價方法的指導,初步構建一個確定價格區間在前、實施定價策略在後,考慮市場供求和價格反饋實時性的大數據定價流程,並且根據上述對定價方法的分類將定價流程劃分為需求、成本、利潤、市場、動態5個模塊,如圖1所示。首先,數據供應商進行數據供給的前提是數據的生產成本能得到充分補償,因此,基於成本導向法得到的價格是賣方避免虧損的價格下限。與此同時,需求對價格的決定性作用是不可忽視的。通過分析用户自身的需求以及數據對用户的效用,進而把握消費者的支付意願,並據此來制定數據價格上限是必要的。在上述價格區間中,供應商可以通過進一步的定價策略來獲取最大利潤,這部分涉及的主要是版本定價、捆綁定價等利潤導向型定價方法。此外,隨着大數據市場日趨成熟,市場會根據供求狀況對價格發揮調節作用。此時,應將市場上其他同類數據的價格作為參考,因為只有當定價不高於市場價格時,該數據才具有出售的競爭力。上述4個模塊通常也適用於傳統商品的定價,而對於大數據還需考慮其價值的時效性,因此必須保證及時對數據進行定價並反饋,此處可以依據基於查詢的定價方法等。
圖1 大數據定價流程分析
5 結束語
大數據為企業帶來了機遇,同時也使其面臨更激烈的競爭環境、更分散的市場和更個性化的消費者偏好,數據定價成為企業獲取競爭優勢的關鍵。目前的研究主要依賴於一些特定假設,許多實際問題並未得到解決,如評估人員的主觀性和定價所需的實時性。國內研究還存在一些不足,今後可以從以下幾方面進行研究。
● 完善數據定價理論框架:鑑於單一的指標或模型在數據定價中存在的不足,目前亟待構建一種考慮利潤、市場供求、數據產品特徵和成本結構等的多指標體系,從而為數據定價提供可靠的支持。數據定價應以成本導向的定價為價格下限,顧客導向的定價為價格上限,以市場導向的定價為價格參照,以利潤和消費者福利最大化為目標。在實際工作中,需根據大數據本身的價值特點,在數據經濟和產品定價以及資產評估的理論指導下,建立大數據定價的理論體系,綜合利用多種定價手段聯合進行,實現數據的科學客觀定價。
● 滿足多樣化和複雜化的用户需求:針對用户偏好的差異化定價將是大數據市場化發展的必然趨勢。通過對潛在客户進行問卷調查以及訪談等,對客户的個性化需求進行深入分析,再借助捆綁定價、基於查詢的定價、基於數據類型的定價等方法,形成差異化的定價機制。
● 量化用户效用:從更加長遠的角度來看,用户效用不應該被忽視。基於此,應注重數據的本身價值和用户效用。可將數據質量等數據特徵作為用户效用的度量指標,建立普適的、可解釋的數據質量評價體系和數據質量量化模型 。
● 實現大數據動態定價。目前大多數定價方法為靜態定價,而大數據的價值是隨着時間波動的 。為了提高實際性和合理性,可以假定數據價格是時間的函數。對於如何將價格及時反饋給用户,可以通過創建在線數據查詢服務並開發相應模型來實現 。
總體來説,大數據定價需要確定價格區間,然後通過各種定價策略,實現大數據市場的規範化和透明化。
作者簡介
劉枬(1966-),男,博士,重慶交通大學經濟與管理學院教授,主要研究方向為數據分析、工程管理信息化。
郝雪鏡(1997-),女,重慶交通大學經濟與管理學院碩士生,主要研究方向為工程管理信息化。
陳俞宏(1994-),女,就職於重慶市軌道交通(集團)有限公司,主要研究方向為項目評價。