研發(fā)級(jí)數(shù)據(jù)分析師就需要掌握編程知識(shí)了,對(duì)于數(shù)據(jù)分析,如果只是給定準(zhǔn)備好而對(duì)數(shù)據(jù)及,做簡(jiǎn)單的描述性統(tǒng)計(jì)、簡(jiǎn)單繪圖,那么不太需要掌握任何編程語言;
問題是,現(xiàn)實(shí)中收集到的數(shù)據(jù)是多樣的、基礎(chǔ)的,就很少能直接滿足模型對(duì)數(shù)據(jù)規(guī)格的要求以及模型成立的假設(shè)二,那么就需要分析前變換、合并、分類、整理數(shù)據(jù),此時(shí)可能需要從數(shù)據(jù)庫使用SQL跨表查詢,數(shù)據(jù)整理好后利用模型做統(tǒng)計(jì)推斷或者機(jī)器學(xué)習(xí)等等,形成樣本內(nèi)或者樣本外的預(yù)測(cè),可能還要用可是化的方式呈現(xiàn)結(jié)果;
這整個(gè)過程中,各個(gè)環(huán)節(jié)都可能涉及到大量的參數(shù)需要調(diào)節(jié),各種細(xì)節(jié)都需要控制,還有很多的主觀選擇;這樣的過程?用軟件去實(shí)現(xiàn),窗口中的選擇將非常復(fù)雜整個(gè)過程需要在多個(gè)數(shù)據(jù)及數(shù)據(jù)重復(fù)執(zhí)行也很麻煩;
用編程語言可以的描述整個(gè)過程,控制大部分細(xì)節(jié),并且可以批量的重復(fù)實(shí)現(xiàn);
總之,對(duì)于數(shù)據(jù)分析師來說,如果想在數(shù)據(jù)分析的道路上走的更遠(yuǎn),編程還是要掌握的;