Click here if you would prefer to read the English version.
我們的世界充滿著數據,每個人的生活都離不開數據。當每分每秒都有數TB的信息產生,這些數據會被怎樣處理?這些數據對未來有什麼價?它隱藏著現實世界中的答案嗎?
如果您對答案感到好奇,數據科學領域或許適合您。
簡而言之,數據科學是一個特殊的跨學科領域。數據科學用於理解大量結構化和非結構化數據的意義。這些數據的意義可促使企業採取更好的措施以增加銷售額。
以上是從商業角度出發,但對您而言,數據科學是從原始數據中了解未來的趨勢和模式,再由此設計出解決方案。
數據就是黃金,每個渴望未來蓬勃發展的企業都需要依靠數據。數據不但對保持競爭力很重要,還有保留客戶和提升客戶參與度的作用。
企業需要了解客戶的喜好和需求、新興趨勢以及在市場上最有需求的產品或服務。根據畢馬威(KPMG)會計師事務所的調查,81%的企業依靠數據分析來增加對客戶的了解。
香港在數據科學領域上較其他科技城市遜色,例如:倫敦、新加坡和矽谷等。在香港,要成為數據主導企業困難嗎?但隨著香港政府對科技初創公司的推動,情況出現了極大轉變。物流、地產商、酒店、零售、醫療保健、保險和金融等領域都開始對數據科學家有大量的需求。
人才質素是數據分析中最重要的一環。除非公司的企業分析部門擁有數據科學家,否則企業將難以興旺發展。
掌握未來的關鍵在於積累、理解和評估數據。隨著越來越多的行業利用數據和科技來領導市場,數據科學將是未來的指標。難怪它被譽為21世紀最有前景的職位之一。
根據香港城市大學數據科學學院的數據顯示,由2017年起數據科學家和數據分析師已成為香港十大最受歡迎的科技專業人員之一;而根據Glassdoor的數據,數據科學家自2016年以來每年均被評為Glassdoor最佳工作榜首。
另請閱讀: 如何成為香港的數據科學家
數據科學確實是一個廣闊的領域。但更重要是其不斷發展的特色。因此如果想永遠成為數據科學領域上的專家是近乎不可能的,但想找到正確的職業道路就很有可能。
在好奇心迫使下,您必定已對數據科學家的工作進行了大量研究。您是否對數據挖掘、數據庫、機器學習和數據分析之類的術語感到不知所措?您是否覺得儘管您明白這些術語,卻無法透過這些術語了解數據科學的整體情況?不用擔心,因為您並不孤單!讓我們現在來釐清這種困惑。
另請閱讀: 成為數據科學家的七大迷思(英文版)
現在忘記所有這些專業術語,僅關注您的個人特質和喜好。讓我們看看您可以在數據科學領域採取什麼樣的職業道路。您肯定已在網上看到各種奇特的職業名稱和職責。但其實數據科學的職業生涯可歸納為三個主要類別。讓我們看看擅長該在類別的人通常具備什麼特質。
數據科學中的3個主要工作類別:
另請閱讀: 談談數據分析與數據科學
以下為您提供有關從事數據科學職業的薪金資料。讓我們來看看上述類別在香港的工作趨勢。
(資料來自PayScale)
(資料來自Glassdoor)
為了清楚地了解從事數據科學的要求,讓我們來看看數據科學的基礎結構。
數學知識是最重要的要求,因為數據科學完全基於統計和概率。
處理數據意味著整天都要使用電腦。電腦編程和純熟地使用編碼語言是數據科學內任何專業領域的關鍵要求。
所有數據最後都會用於制訂重大的業務決策,因此必須具備高度商業敏銳度。
在數據科學中您需要有效地進行團隊工作,擁有強大的溝通能力是您在數據科學領域中獲取成功的唯一途徑。
牢記這些重點,讓我們探討一下從事數據科學必須具備的教育水平。
這些是人們可以選修並繼續學習數據科學的一些課程。但事實上您可以通過報讀專業的編程訓練營(Coding Bootcamp),例如短期全日制數據科學和機器學習訓練營,透過4個月的密集式訓練,掌握真實工作中需要的數據科學技能。
另請閱讀: XCCELERATE故事: 高中畢業生 4個月內成為科技專才
但在深入探討前,讓我們先消除您對那些術語的困惑。以下讓我們看看每個術語對數據科學的意義。
數據科學是以下所有術語的統稱:
它是所有數據挖掘和機器學習計算程式的基礎。它涉及樣本數據、人口和假設等概念。
從數據庫(databases)、數據倉庫(data warehouses)或複雜的數據集(datasets),例如時間序列或空間中,收集大量數據進行挖掘,以獲取數據項之間有趣的關聯、趨勢和模式。
人們可能會對數據科學和數據分析之間的差異感到困惑。數據分析涉及使用統計和/或編程來分析數據,以找到有趣的關聯、趨勢、模式和有用的見解。
一種用複雜的計算程式來處理大數據的技術,並使用電腦或人工智能將結果傳遞給用戶。機器學習的目標是理解數據,並建立人們可以理解和使用的模型。
由於物理或計算限制,處理大型數據集通常不可行或無法實現。因此需要特殊的技術和工具,例如軟件、計算程式、平行編程(Parallel programming)等。大數據即是包括大型數據集、專用技術和定制工具的術語。
編程技能、統計知識和解難能力,就是一名數據科學家的武器。以下是數據科學家最有市場價值的一些技能:
在基本了解數據科學後,是時侯了解一下這三種主要職位類別中,每種類別所需的技能和不同的角色。
以下將為您說明數據工程師、數據科學家和數據分析師之間的分別:
構建軟件以創建可行的基礎數據結構,從而挖掘新數據、組織原始數據和存儲數據。
報讀內容豐富的數據工程課程,將能把握在數據工程領域中龐大的工作機會。
分析數據模式及關係,並以數據為其他團隊尋找答案
報讀內容廣泛的機器學習和數據科學課程,或會在成為數據分析師的路上帶來龐大的機會。
在數據分析師的研究結果中增添創意思維,利用全面的評估報告作出企業的決策或預測。它在職責在很大程度上涉及機器學習。
在此類別中,數據科學家通常是跨行業存在的唯一工作角色。可以有不同的資歷級別,但職位概況保持不變。
在香港報讀兼讀制的Python入門課程或數據科學課程,有助踏入數據科學的領域。
另請閱讀: 為什麼PYTHON是數據科學領域必學的語言?
對於從未接觸這領域的您可能會問:數據科學難學嗎?如何選擇課程?其實課程的選擇取決於您已有的技能和資歷。如果您無法報讀全日制課程,請考慮兼職課程。因為這些課程將會使您更認識數據科學行業情況,並幫助您更了解各種工作的細微差別。
Xccelerate有專門提供給初學者的兼讀制的python入門課程和數據科學課程,以幫助您學習以下類別的基本知識:
若您想先從零開始學習所有基礎知識,然後才選擇新的職業,那麼您最好選擇更全面的課程。 Xccelerate的4個月全日制數據科學和機器學習課程非常適合初學者。這些課程不需要任何入讀要求,適合任何想從零開始轉行學習數據科學的人。
完成課程後有許多工作機會,例如:
如果您已具備豐富的編程背景,特別是R和Python技能,則可以選擇有強大的職業支援的進階數據科學和機器學習課程。這個數據科學課程有關於領域的專業知識、高級數據科學工具和團隊職業支援。
香港的數據科學正蓬勃發展,這是您投資相關技能的好時機!這些技能可以帶來非常有趣和有意義的職業。由於現時很少著名大學有提供數據科學的專業課程,因此最好的選擇首先完成專上學位,然後再報讀獨立教學機構提供的數據科學課程,例如Xccelerate。
若您正處於職業生涯的分岔路,又需要有人幫助您應對專業挑戰,您可以預約我們的免費一對一職業諮詢,並獲得為您而設的職業建議。
另請閱讀: 10個開始數據科學職業生涯的方法