新聞中心
該如何學習大數(shù)據(jù)知識?
本人工作以來一直在大數(shù)據(jù)領(lǐng)域深耕,對于大數(shù)據(jù)的入門者有少許的建議。大數(shù)據(jù)領(lǐng)域的工作方向主要分為以下幾類:

成都創(chuàng)新互聯(lián)是一家以重慶網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計、品牌設(shè)計、軟件運維、營銷推廣、小程序App開發(fā)等移動開發(fā)為一體互聯(lián)網(wǎng)公司。已累計為廣告設(shè)計等眾行業(yè)中小客戶提供優(yōu)質(zhì)的互聯(lián)網(wǎng)建站和軟件開發(fā)服務。
1.計算平臺方向
2.數(shù)據(jù)處理方向
3.數(shù)據(jù)分析方向
4.算法應用方向
目前大部分公司的子部門也基本按這些進行細分,上述各個領(lǐng)域的側(cè)重點也不一樣。
1.計算平臺方向。自從07年hadoop技術(shù)橫空出世以后,使得廉價的機器也能部署成分布式計算環(huán)境,所以這塊技術(shù)主要圍繞著hadoop生態(tài)。這個需要學習hdfs分布式文件,hbase或hive分布式數(shù)據(jù)庫技術(shù),spark或者flink等分布式計算技術(shù),zookeeper等分布式協(xié)調(diào)技術(shù)等。根據(jù)個人喜好可以側(cè)重底層技術(shù)的優(yōu)化及維護,或者基于這些技術(shù)的應用開發(fā)。
2.數(shù)據(jù)處理方向,大致是指ETL工程師。該職位主要是加工處理各個數(shù)據(jù)源的數(shù)據(jù),包括日志收集的、業(yè)務庫產(chǎn)生的等。根據(jù)這些數(shù)據(jù)供其他工種的同學進行使用,比如產(chǎn)生各種報表,或者拿來給算法做訓練。這一塊側(cè)重sql技術(shù)或者python技術(shù),他們更側(cè)重于對業(yè)務的理解,技術(shù)相對弱化一點。
3.數(shù)據(jù)分析方向。這塊的崗位主要是數(shù)據(jù)分析師,實際中使用比較多的是sql和excel。如果把業(yè)務比喻成人,數(shù)據(jù)就是血液,而數(shù)據(jù)分析師就是通過血液進行人體癥狀判斷的醫(yī)生。很多時候數(shù)據(jù)分析師比業(yè)務方還懂業(yè)務,他們需要分析業(yè)務的痛點,通過分析數(shù)據(jù)尋找解決方案。這塊需要很強的邏輯分析能力和溝通能力。
4.算法工程師。這個基本上處于大數(shù)據(jù)食物鏈頂端的工種。他們需要精通高數(shù)、高代、概率論與統(tǒng)計等等數(shù)據(jù)基礎(chǔ),同時需要掌握python或scala至少一門語言,需要掌握機器學習或深度學習的知識。門檻相對其他工種稍高一點?;A(chǔ)的算法工程師一般調(diào)用算法開發(fā)包進行業(yè)務開發(fā),同時進行參數(shù)調(diào)優(yōu)。高級的算法工程師需要看論文自己實現(xiàn)算法,或者根據(jù)業(yè)務情況優(yōu)化數(shù)學公式。如果想從事這塊,你需要很扎實的數(shù)學基礎(chǔ),并且要熱愛數(shù)學才能持之以恒堅持下去。
額,感覺你的問題問的有點泛。目前我也在學大數(shù)據(jù),個人建議可以從以下幾個步驟開始學習大數(shù)據(jù)。第一、先學習基礎(chǔ)知識,基礎(chǔ)知識包括java se,Linux,數(shù)據(jù)庫之類的。第二、學習Hadoop,Spark,Yarn,MapReduce之類的,數(shù)據(jù)存儲和處理架構(gòu)。第三、開始做點稍微有含金量的項目之類的。這僅僅是個人的感覺,由于目前我也在學習階段,回答的可能有欠缺,歡迎各路大佬批評指正。
1.首先你需要對大數(shù)據(jù)有一個清晰地認知,什么是大數(shù)據(jù)?大數(shù)據(jù)都能干什么?我對大數(shù)據(jù)感興趣嗎?能堅持下來嗎?我要學習大數(shù)據(jù)現(xiàn)在有什么基礎(chǔ)?還有什么地方要補足?學習大數(shù)據(jù)之前千萬要想好這些,要不很有可能你學習到一個階段就半途而廢了。
2.如果你之前沒有編程的經(jīng)歷,那么你要選擇一門編程語言去輔助你做大數(shù)據(jù)項目。我建議學習Java,現(xiàn)在Java培訓機構(gòu)很多,網(wǎng)上的視頻文章等學習資源也很多,而且大數(shù)據(jù)相關(guān)技術(shù)棧中有相當一部分也是Java開發(fā)的,所以懂Java對于你學習大數(shù)據(jù)有很大的幫助。
3.如果你有Java基礎(chǔ),或者通過學習已經(jīng)掌握了JavaWeb相關(guān)的技術(shù),例如數(shù)據(jù)庫,數(shù)據(jù)結(jié)構(gòu),JQuery,Spring等,就可以開始接觸大數(shù)據(jù)相關(guān)的技術(shù)了。這一階段需要學習的知識很多,批處理框架Hadoop,分布式文件管理系統(tǒng)HDFS,流式計算框架Spark,交互式框架Hive等,另外你還需要惡補一些數(shù)學知識,如概率論,離散數(shù)學,統(tǒng)計學等。
4.實踐是檢驗真理的唯一標準,理論知識充足時候一定要實踐,記住,實踐非常重要,最好結(jié)合身邊的應用場景,做一到兩個大數(shù)據(jù)的項目,跟隨著項目,你才能以最快的速度成長。
5.不斷地學習新的知識技術(shù),多去拜讀大數(shù)據(jù)相關(guān)的論文,其實到大數(shù)據(jù)層面,更多的是解決問題的思路而不是解決問題的辦法。
謝謝邀請!
大數(shù)據(jù)是我的主要研究方向之一,同時也在帶大數(shù)據(jù)方向的研究生,所以我來回答一下這個問題。
學習大數(shù)據(jù)首先要根據(jù)自身的知識結(jié)構(gòu)選擇學習方向,比如數(shù)學和統(tǒng)計學專業(yè)的學生可以選擇數(shù)據(jù)分析方向,而計算機專業(yè)的學生可以選擇大數(shù)據(jù)開發(fā)方向,不同的學習方向需要制定不同的學習計劃。
雖然不同的學習方向往往需要學習不同的內(nèi)容,但是對于零基礎(chǔ)的學習者來說,以下三方面基礎(chǔ)知識是都需要學習的:
第一:編程語言。不論是選擇大數(shù)據(jù)分析方向還是大數(shù)據(jù)應用開發(fā)方向,掌握編程語言都是學習大數(shù)據(jù)的重要基礎(chǔ)。目前在大數(shù)據(jù)領(lǐng)域應用比較廣泛的語言包括Java、Python、Scala、R和Go等,其中Java在Hadoop平臺應用比較多,而Scala在Spark平臺應用比較普遍。從目前的應用趨勢來看,學習Python則是不錯的選擇,既可以從事大數(shù)據(jù)開發(fā),也可以從事大數(shù)據(jù)分析。
第二:大數(shù)據(jù)平臺。學習大數(shù)據(jù)知識繞不過大數(shù)據(jù)平臺,大數(shù)據(jù)平臺承載了分布式存儲和分布式計算的核心任務,所以大數(shù)據(jù)平臺研發(fā)也是目前大數(shù)據(jù)領(lǐng)域的重要崗位。目前Hadoop和Spark是比較適合初學者學習的大數(shù)據(jù)平臺,一方面是其開源的屬性,另一方面Hadoop對于硬件的要求也比較低。
第三:算法。大數(shù)據(jù)技術(shù)的核心訴求是數(shù)據(jù)價值化,而目前數(shù)據(jù)價值化的主要方式就是數(shù)據(jù)分析,所以掌握算法不僅對于數(shù)據(jù)分析崗位非常重要,對于大數(shù)據(jù)開發(fā)崗位也具有現(xiàn)實的意義??梢哉f,大數(shù)據(jù)產(chǎn)業(yè)鏈內(nèi)大量的崗位任務都要圍繞算法展開,所以掌握算法是學習大數(shù)據(jù)技術(shù)的核心任務之一。學習算法可以從一些經(jīng)典的算法開始,比如kNN、決策樹、樸素貝葉斯、支持向量機等等。
我從事互聯(lián)網(wǎng)行業(yè)多年,目前也在帶計算機專業(yè)的研究生,主要的研究方向集中在大數(shù)據(jù)和人工智能領(lǐng)域,我會陸續(xù)寫一些關(guān)于互聯(lián)網(wǎng)技術(shù)方面的文章,感興趣的朋友可以關(guān)注我,相信一定會有所收獲。
如果有互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等方面的問題,或者是考研方面的問題,都可以在評論區(qū)留言!
到此,以上就是小編對于ubuntu 安裝redis的問題就介紹到這了,希望這1點解答對大家有用。
網(wǎng)頁名稱:該如何學習大數(shù)據(jù)知識?(ubuntu如何安裝redis查看工具)
當前鏈接:http://www.5511xx.com/article/cohsipp.html


咨詢
建站咨詢
