1. 首頁
  2. 其他

資料分析常見的三大誤區

關於資料分析常見的三大誤區

我們要意識到,使用者“怎麼說”和“怎麼做”不同,甚至經常有矛盾,有時候使用者的行為比語言更能反映出他的真實需求。比如使用者說在搜尋買家的時候應該加一個“按交易額搜尋”的條件,也許只是他某次特殊的需要使然,但如果我們聽他的做了這個功能,之後透過使用者行為的資料分析發現,只有1/10000 的人用過,那就表明我們被使用者的說法騙了,但資料永遠不會騙我們。不過,在資料分析時也會有一些特定的問題,下面讓我們逐一分析。

第一,過於學術,沉迷於“科學研究”。

我在讀研的時候,做的就是統計分析、資料探勘相關的課題,所以工作中開始遇到資料分析的時候,我挺興奮的,感覺可以好好地研究一番了。但漸漸我體會到,實際的生產和科研是有很大不同的。科學研究通常只注重“價效比”的性,只要結果好,往往不在乎投入,因為相對而言科研的結果不是為了馬上應用,而是為了證明實力。但實際生產環境就更注重綜合的價效比了,所以我們日常的資料分析方法也就顯得不那麼嚴謹了,我特指小步快跑的.創業團隊,他們可能不需要在每次分析前都去驗證樣本群體是否符合某種統計分佈,也可能不需要用“人工神經網路”等“高科技手段”去預測產品將來的使用者數,甚至給出“A>B”的結論時也用不著做“顯著性檢驗”,一切的一切需要的只是一種感覺,一種對資料的敏感,對商業的敏感。現實和理想的差距

第二,雖然資料不會主動騙人,但我們經常無意或有意地誤讀資料。

無意地誤讀資料,舉個例子,對一個人群,人們的身高用平均數來衡量是有意義的,因為我們知道身高屬於典型的正態分佈,中間多兩邊少,所以一個平均值就能瞭解群體的大致情況,而對人們的收入,就不能用平均值來衡量了,一個超級富豪和1000個零收入的人一平均,很可能得出人均收入100 萬的荒謬結論。這個問題的對策,是學習統計學的知識,這是一個很實際的問題,我們經常在做決策的時候才想起來資料分析,但忽然發現,努力提高自己的水平。主動地誤讀資料,是比較有趣的現象。在提取資料之前,我們心中通常已經有一些結論了,無非是想驗證它,而抱著這點思想,就總能找到資料來證明自己已有的想法,並且技術越嫻熟的人越容易做到這點。對於這點,我想一個簡單的對策就是對資料保持中立的態度,儘量不要“為了迎合一個觀點而去找資料”,減少利益牽扯,比如為了證明老闆的判斷,或者為了保持自己之前拍腦袋的英明形象等,你明白我的意思。

第三,平時不燒香,臨時抱佛腳。

這是一個很實際的問題,我們經常在做決策的時候才想起來資料分析,但忽然發現手頭沒有資料可分析。一次又一次地發生同樣的情況……為了避免,我們應該在產品設計的時候就把資料分析的需求加進去,比如記錄每個按鈕的點選次數、統計每個使用者的登入頻率等,這也算一種典型的非功能需求,這樣做對產品的可持續發展非常必要。