在「激進市場」(Radical Markets) 這本書裏提過一個概念:「數據即勞務」,大約就是指將提供數據此一行為視為勞務,並可得到報酬,如同工作一樣。
215Please respect copyright.PENANA0f0MQrZqJe
近年「大數據」這個詞的出現次數越加瀕密,因為他背後所帶來的影響和利益正在改寫世界的脈絡。透過分析數據,我們可以作出更全面的比較、做更準確的決定、令市場更具效率。「數據」自身的價值越來越高,它就像生產中的原材料、或是農場裏的飼料,餵給機器後,機器就能成長。例如所謂機器學習就是透過一大堆資料,找出當中的規律,再為未來新的數據進行預測。
215Please respect copyright.PENANAKUFZEoAS0r
既然如此,人類作為數據的提供者也參與在這條供應鏈之上創造了價值,獲得報酬也非常合理。當然,現時人類也非完全無償地提供數據。好比我們使用臉書的時候,我們的相片、個人資料等都會存入臉書的數據庫,它可借此改善其廣告營運模式 (如更加客製化),並藉此吸引商業客戶購買。而臉書用家在這盤生意所得到的報酬,可以說是免費的社交平台服務。其他例子如填問卷可以得到現金劵、參加研究可獲車馬費,提供數據可以得到報酬的概念好像已經存在於社會之中。
215Please respect copyright.PENANAPlXJQ9DZdy
不過在這些情況之下,數據的質素亦成為問題,有時只收集到一堆雜亂無章的資訊,甚至是雜訊,又或是會忽略某些數據上的小眾,做成偏誤。所以正視「數據即勞務」這個概念,其一方向是將提供數據此一生產行為商業化,並讓人為此而工作,提供高質素的數據者得到高報酬,由市場去管理數據的質素。而高質素的數據則可完善大數據分析、machine learning、AI等領域的發展。
215Please respect copyright.PENANAoRoRcniIG2
與此同時,社會上不同領域的「小眾」都能夠提供數據。另一本書「被隱形的女性」就指出過現時數據背後的問題,該書以女性為中心,指的是現時大多演算法所採用的學習數據都由男性提供,或者男性為基準,結果學習完成的機器就更適合男性使用。不適合女性使用的機器當然會減少女性的使用率,然則在回饋效應之下,由於機器收集到女性的回饋較少,結果它在自我學習、進步的過程中則更偏向男性,造成惡性循環。女性或許是一個群組,社會上仍然有其他許多不同的「小眾」被數據所忽視,他們為市場提供數據自可以完善演算系統,亦可促進社會多元。
215Please respect copyright.PENANAcZFzRaryTT
而他們的價值也不止於上述「社會價值」式的利益,亦可協助商界開拓利基市場。人們可以把數據勞務的焦點放在自己的興趣,如語言學習、文化意識之上,為各種獨特的生活模式提供數據,商家亦可藉此尋找隱藏或未完全開發市場。
215Please respect copyright.PENANAbGJ9tPY8xe
當我們正視提供數據為一種勞務,應該得到報酬時,這種概念亦可進一步延伸,為社會提供廣泛利益,下章待續。
ns 15.158.61.17da2