數據是未來的原材料
電商交易量每年增加一倍,但對所積累數據的了解程度是否跟著增加一倍呢?如果電商現在不開始收集數據及應用起用,未來要用數據的時候,就會發現過去的數據已經是一堆垃圾。 許多人已經開始意識到,未來的電商是數據之戰,在這種大數據的背景之下,電商收集數據的邊界在哪里?又該如何快速運用數據做出正確的商業決策?這是多數電商公司的困擾。
數據是越多越好嗎
后來在美國遇到Patil,他認為過去收集數據很難,而現在獲取數據資源變得更容易。但是如果收集數據的出發點,不是為了解決問題,那么收集再多的數據有什么意思呢?
可是許多公司還有一個疑問是,現在收集數據不難,成本也不高,為什么不先收集數據再說呢?等以后需要數據來解決問題時再拿出來用也可以。Patil的答案我也很認同,他勸大家千萬別這么想,用這樣的理念來設計數據應用肯定會失敗的。數據是沒有邊際的,我為此也痛苦了好一段日子。比如收集一個人的生日,可以精確到幾分幾秒,但這么精確的數據有什么應用,能產生什么價值呢?
事實上,數據是有生命周期的,比如從中國身份證號碼是可以推斷出性別的,但是過幾年如果這個規則變了,導致我們基于數據所做假設和決策依據也就失去了意義(Data Broken)。更何況保存數據及其收集時的背景(Context)也是一件不容易的事情。所以說,在收集數據的同時,我們必須知道未來可以用來做什么,今天都想不出來的話,日后就更不容易想出來了。
打一個比方,今天很多電商老板會問重復購買率是多少,于是我們收集數據來計算重復購買率,卻很少想到需要重復購買率來做什么決定。這就好比刻舟求劍這個故事,他告訴我們世事在變,我們不能只是機械的套用方法或指標。就像重復購買率有不同的定義,而做不同的決策需要不同定義的重復購買率。如果從一家投資公司的角度來看重復購買率,它想收購A公司,那么會從重復購買率來看整個A公司的健康程度或用戶質量等。如果從A公司本身運營的角度來看重復購買率,那么它更關注的是日、周級別的重復購買率的變化趨勢,或者當月新增客戶有多少人在三個月后的重復購買,從而可以衡量每個月新增及存量客戶的忠誠度和質量,找出改善的空間。知道了以上的背景之后才去選擇用什么數據不是更靠譜嗎?
數據應用因小而美
從2011年年底,我開始思考怎么從“用數據”轉變為“養數據”(即數據運營轉變為運營數據),這一段時間我特別為收集什么樣的數據而煩惱(more data, more problem)。而且,我也曾經想做一個特別大的適合多數人使用的數據應用出來(虛火上升),可是后來發現這在數據應用的起步階段幾乎是不可能的,一是找到可以解決大部分人需求的數據應用不容易,二是支付寶的數據非常豐富,需要考慮的因素很多,因素之間的聯系又很復雜。
所以,我總結,當做數據應用的時候,數據就是等于原材料,當原材料一直處于變化的情況下,做出來的產品很容易出問題。體會數據和應用的關系之后,我最后決定從小角度切入,先做小應用出來(很好的瞄準器)。