高效的資料分析方法不是馬上就能學會的,但是可以透過快速學習掌握基本的要領。簡單介紹幾個分析資料的方法和習慣:
1.重視分析的簡單性
產品資料分析的重點不是分析,但你還是需要分析,只是它的故事和基於資料的推薦真的很重要。
複雜的分析造成的混亂將導致獲得完全相反的結果,如果你的分析是不清晰的,工程師就不能快速透過你的分析獲得知識,那麼你的分析就會失去價值。
關於資料分析的影響力的最終測試是根據工程和投資行為的改變程度,所以更應該令資料分析變得容易,方便人們使用,得以實現改變。
2.重視資料的來源
一定時間裡看更多的資料可以給你在分析上更多的信心,但是遙測或日誌作為單一的傳遞途徑會被捕捉到的特性所限制。
你需要的是其他資料來源,可以是所有被登記在某處的SQL操作記錄,或者是有工具可以從你的使用者那裡獲得日誌樣本,更多的資料來源也會讓你確定你的故事是否一致。
3.重視熟悉的工具
你希望工具變的容易,能夠被人們所使用並得到自己想要的改變,但是改變不是這麼容易的。
使用你熟悉的工具,講述那些快速吸引大家注意力的故事
深入分析核心資訊
重複核心資訊,不斷的重複
4.相比信任,更加重視CUSS
中心:資料的總體趨勢所在
異常特徵:有缺失的資料點?離群值?叢集?
傳播:資料產生哪些變化?
形狀:如果你來繪製資料,資料的形狀是什麼?
5.軟體的實際工作更重要
產品資料分析的優點是看到實際使用者使用你的軟體產品的足跡,有時你會得到一個很好的的足跡,但也有可能得到的部分足跡讓你的調查更加困難。無論如何,遙測和日誌的足跡都是現實的反映。
架構知識是偉大的資產。但是,遙測和日誌透過確鑿的證據告訴我們實際發生了什麼,結果並不是我們希望看到的。
資料分析工作常見的錯誤規避技巧
1。 相關關係和因果關係之間的混亂
大部分的資料科學家在處理大資料時假設相關關係直接影響因果關係,使用大資料來理解兩個變數之間的相關性通常是一個很好的實踐方法,但總是使用“因果”類比可能導致虛假的預測和無效的決定。
2。 沒有選擇合適的視覺化工具
大部分的資料科學家專心學習資料分析的方面的技術,即使開發了一個最優秀和最好的機器學習模型,它也不會大叫說“尤里卡”——所有這些所需要的是結果的有效視覺化,可以理解資料模式的不同,和意識到它的存在可以被利用來獲得商業成果。
3。 沒有選擇適當的模型
由於幾個因素,模型的預測能力往往會變弱,因此資料科學家需要確定一個常數,用以確保模型的預測能力不能低於可接受的水平。為了保留已建模型的預測效果和有效性,選擇迭代週期是非常重要的,如果做不到,可能會導致錯誤的結果。
4。 只關心資料
資料科學家經常給與資料太多決策制定的權力,他們不夠重視發展自身商業智慧,不明白分析如何令企業獲益。
資料科學家應該不僅僅讓資料說話,而且善於運用自身的智慧,資料應該是影響決策的因素而不是資料科學專案決策制定的最終聲音。
5。 忽視可能性
資料科學家經常傾向性忘記方案的可能性,這將導致作出更多的錯誤決策。資料科學家經常犯錯,對於特定的問題沒有唯一的答案,因此要確認資料科學家從不同可能性中所做的選擇。
7。 建立錯誤人口數量的模型
建立該模型不僅要考慮那些具有高度影響力的客戶的行為資料,也要考慮那些不怎麼有影響力但是具有潛在影響力的客戶的行為資料,低估任何一邊人口的預測力量都可能導致模型的傾斜或者一些重要變數的重要性下降。
END
調研工廠丨https://survey。work