電商數據分析十大模型
數據分析不是一件簡單的事情,要想做好,就要好好學會一些基本的模型,當然并不是所有模型都要會,只要好好利用其中幾種,就可以達到非常好的數據分析效果。
1、基于歷史的MBR分析
以史為鏡可以知得失,MBR同樣就是基于這樣的思想產生的,通過分析以前發生過的事情,來推斷未來類似事情發生的一些特性。這種分析方法需要大量的歷史數據,只有有了足夠的歷史數據方能做出相對較好的預測。這一點對于我們做電子商務的啟示,就是要我們要注重數據的積累和收集,通過數據來把控市場的變化和消費者行為的變化。
2、購物籃分析
購物籃分析就是找出什么樣的東西放在一起更加容易獲得消費者的喜愛,即便兩件看上去沒有關系的商品,卻可能獲得很好的銷售收益,這就是商品之間的關聯性,購物籃分析就是要找到這種關聯性。舉例來說,零售店可藉由此分析改變置物架上的商品排列或是設計吸引客戶的商業套餐等等。
3、決策樹
決策樹分析法是常用的風險分析決策方法。決策樹在解決歸類與預測上有著極強的能力,它以法則的方式表達,而這些法則則以一連串的問題表示出來,經由不斷詢問問題最終能導出所需的結果。比較以及選擇的方法,其決策是以期望值為標準的。人們對未來可能會遇到好幾種不同的情況。每種情況均有出現的可能,人們目前無法確知,但是可以根據以前的資料來推斷各種自然狀態出現的概率。在這樣的條件下,人們計算的各種方案在未來的經濟效果只能是考慮到各種自然狀態出現的概率的期望值,與未來的實際收益不會完全相等。
4、聚類分析
這個技術涵蓋范圍相當廣泛,包含基因算法、類神經網絡、統計學中的群集分析都有這個功能。它的目標為找出數據中以前未知的相似群體,在許許多多的分析中,剛開始都運用到群集偵測技術,以作為研究的開端。
5、遺傳算法
遺傳算法學習細胞演化的過程,細胞間可經由不斷的選擇、復制、交配、突變產生更佳的新細胞。基因算法的運作方式也很類似,它必須預先建立好一個模式,再經由一連串類似產生新細胞過程的運作,利用適合函數決定所產生的后代是否與這個模式吻合,最后僅有最吻合的結果能夠存活,這個程序一直運作直到此函數收斂到最佳解。基因算法在群集(cluster)問題上有不錯的表現,一般可用來輔助記憶基礎推理法與類神經網絡的應用。
6、連接分析
連接分析是以數學中之圖形理論為基礎,藉由記錄之間的關系發展出一個模式,它是以關系為主體,由人與人、物與物或是人與物的關系發展出相當多的應用。例如電信服務業可藉連結分析收集到顧客使用電話的時間與頻率,進而推斷顧客使用偏好為何,提出有利于公司的方案。除了電信業之外,愈來愈多的營銷業者亦利用連結分析做有利于企業的研究。
7、羅吉斯回歸分析
當判別分析中群體不符合正態分布假設時,羅吉斯回歸分析是一個很好的替代方法。羅吉斯回歸分析并非預測事件是否發生,而是預測該事件的機率。它將自變量與因變量的關系假定是S行的形狀,當自變量很小時,機率值接近為零;當自變量值慢慢增加時,機率值沿著曲線增加,增加到一定程度時,曲線協率開始減小,故機率值介于0與1之間。
8、神經網絡
神經網絡是以重復學習的方法,將一串例子交與學習,使其歸納出一足以區分的樣式。若面對新的例證,神經網絡即可根據其過去學習的成果歸納后,推導出新的結果,乃屬于機器學習的一種。數據挖掘的相關問題也可采類神經學習的方式,其學習效果十分正確并可做預測功能。
9、判別分析
當所遭遇問題它的因變量為定性,而自變量(預測變量)為定量時,判別分析為一非常適當之技術,通常應用在解決分類的問題上面。若因變量由兩個群體所構成,稱之為雙群體 —判別分析;若由多個群體構成,則稱之為多元判別分析。
10、OLAP分析
嚴格說起來,OLAP分析并不算特別的一個數據挖掘技術,但是透過在線分析處理工具,使用者能更清楚的了解數據所隱藏的潛在意涵。如同一些視覺處理技術一般,透過圖表或圖形等方式顯現,對一般人而言,感覺會更友善。這樣的工具亦能輔助將數據轉變成信息的目標。
數據分析十大模型,是經過歷史證明非常有效的模型,靈活運用會獲得非常不錯的效果。