【2021香港職業指南】數據科學和機器學習

Thomas Ho

19 Mar 2021

Click here if you would prefer to read the English version.

我們的世界充滿著數據,每個人的生活都離不開數據。當每分每秒都有數TB的信息產生,這些數據會被怎樣處理?這些數據對未來有什麼價?它隱藏著現實世界中的答案嗎?

如果您對答案感到好奇,數據科學領域或許適合您。


數據科學其實是什麼?

簡而言之,數據科學是一個特殊的跨學科領域。數據科學用於理解大量結構化和非結構化數據的意義。這些數據的意義可促使企業採取更好的措施以增加銷售額。

以上是從商業角度出發,但對您而言,數據科學是從原始數據中了解未來的趨勢和模式,再由此設計出解決方案。

數據就是黃金,每個渴望未來蓬勃發展的企業都需要依靠數據。數據不但對保持競爭力很重要,還有保留客戶和提升客戶參與度的作用。

企業需要了解客戶的喜好和需求、新興趨勢以及在市場上最有需求的產品或服務。根據畢馬威(KPMG)會計師事務所的調查 81%的企業依靠數據分析來增加對客戶的了解。

Big Data in City


香港數據科學領域的發展

香港在數據科學領域上較其他科技城市遜色,例如:倫敦、新加坡和矽谷等。在香港 要成為數據主導企業困難嗎?但隨著香港政府對科技初創公司的推動,情況出現了極大轉變 物流、地產商、酒店、零售 醫療保健 保險和金融等領域都開始對數據科學家有大量的需求。

人才質素是數據分析中最重要的一環。除非公司的企業分析部門擁有數據科學家,否則企業將難以興旺發展。

掌握未來的關鍵在於積累、理解和評估數據。隨著越來越多的行業利用數據和科技來領導市場,數據科學將是未來的指標。難怪它被譽為21世紀最有前景的職位之一。

根據香港城市大學數據科學學院的數據顯示,由2017年起數據科學家和數據分析師已成為香港十大最受歡迎的科技專業人員之一;而根據Glassdoor的數據,數據科學家自2016年以來每年均被評 Glassdoor最佳工作榜首


另請閱讀: 如何成為香港的數據科學家


以工作方向探索數據科學領域

數據科學確實是一個廣闊的領域。但更重要是其不斷發展的特色。因此如果想永遠成為數據科學領域上的專家是近乎不可能的,但想找到正確的職業道路就很有可能。


消除對數據科學術語的困惑

在好奇心迫使下,您必定已對數據科學家的工作進行了大量研究。您是否對數據挖掘、數據庫、機器學習和數據分析之類的術語感到不知所措?您是否覺得儘管您明白這些術語,卻無法透過這些術語了解數據科學的整體情況?不用擔心,因為您並不孤單!讓我們現在來釐清這種困惑。


另請閱讀: 成為數據科學家的七大迷思(英文版)


數據科學職業的主要類別

現在忘記所有這些專業術語,僅關注您的個人特質和喜好。讓我們看看您可以在數據科學領域採取什麼樣的職業道路。您肯定已在網上看到各種奇特的職業名稱和職責。但其實數據科學的職業生涯可歸納為三個主要類別。讓我們看看擅長該在類別的人通常具備什麼特質。

using data at work

數據科學中的3個主要工作類別:

1. 數據分析師

  • 喜歡分析大量數據,將原始數據轉變成更易理解的格式,例如圖表或圖形等。

  • 喜歡統計和解讀數據的模式和趨勢。

  • 喜歡勤奮地學習和研究,從而找到迫切的問題的答案。

2. 數據工程師

  • 喜歡編碼和製作軟件。

  • 可以通過演算法思考並創建程式,從而將原始數據結合成結構化數據集。

3. 數據科學家

  • 有能力同時擔任數據工程師和數據分析師。

  • 有創意思維,可以收集數據分析師的答案並從中找到解決方法。

  • 擁有較強的商業敏銳度,可以做出艱難的決定。


另請閱讀: 談談數據分析與數據科學


香港數據科學領域的薪金趨勢

以下為您提供有關從事數據科學職業的薪金資料。讓我們來看看上述類別在香港的工作趨勢。

(資料來自PayScale)

  • 初級數據科學家的平均年薪為港幣$319,950

  • 中級數據科學家的平均年薪為港幣$390,000

  • 資深數據科學家的平均年薪為港幣$520,000

  • 初級數據分析師的平均年薪為港幣$222,000

  • 中級數據分析師的平均年薪為港幣$258,000

  • 資深數據分析師的平均年薪為港幣$374,000

(資料來自Glassdoor)

  • 初級數據工程師的平均年薪為港幣$192,000

  • 中級數據工程師的平均年薪為港幣$276,000

  • 資深數據工程師的平均年薪為港幣$420,000


從事數據科學需要什麼條件?

為了清楚地了解從事數據科學的要求,讓我們來看看數據科學的基礎結構。


數據科學的四大支柱

1. 數學

數學知識是最重要的要求,因為數據科學完全基於統計和概率。

2. 電腦科學

處理數據意味著整天都要使用電腦。電腦編程和純熟地使用編碼語言是數據科學內任何專業領域的關鍵要求。

3. 商業

所有數據最後都會用於制訂重大的業務決策,因此必須具備高度商業敏銳度。

4. 溝通技巧

在數據科學中您需要有效地進行團隊工作,擁有強大的溝通能力是您在數據科學領域中獲取成功的唯一途徑。

牢記這些重點,讓我們探討一下從事數據科學必須具備的教育水平。


建議有關數據科學的學位課程

  • 工程學

  • 科學碩士

  • 數學或統計學

  • 電腦科學

這些是人們可以選修並繼續學習數據科學的一些課程。但事實上您可以通過報讀專業的編程訓練營(Coding Bootcamp),例 短期全日制數據科學和機器學習訓練營,透過4個月的密集式訓練,掌握真實工作中需要的數據科學技能。


另請閱讀: XCCELERATE故事: 高中畢業生 4個月內成為科技專才


但在深入探討前,讓我們先消除您對那些術語的困惑。以下讓我們看看每個術語對數據科學的意義。


數據科學的各種術語

數據科學是以下所有術語的統稱:

統計

它是所有數據挖掘和機器學習計算程式的基礎。它涉及樣本數據、人口和假設等概念。

數據挖掘

從數據庫(databases)、數據倉庫(data warehouses)或複雜的數據集(datasets),例如時間序列或空間中,收集大量數據進行挖掘,以獲取數據項之間有趣的關聯、趨勢和模式。

數據分析

人們可能會對數據科學和數據分析之間的差異感到困惑。數據分析涉及使用統計和/或編程來分析數據,以找到有趣的關聯、趨勢、模式和有用的見解。

機器學習

一種用複雜的計算程式來處理大數據的技術,並使用電腦或人工智能將結果傳遞給用戶。機器學習的目標是理解數據,並建立人們可以理解和使用的模型。

大數據

由於物理或計算限制,處理大型數據集通常不可行或無法實現。因此需要特殊的技術和工具,例如軟件、計算程式、平行編程(Parallel programming)等。大數據即是包括大型數據集、專用技術和定制工具的術語。


哪種技能有市場需求?

編程技能、統計知識和解難能力,就是一名數據科學家的武器。以下是數據科學家最有市場價值的一些技能:

  • 編程語言:R / Python / Java

  • 數據模型

  • 統計與應用數學

  • Hadoop和Spark的工作知識

  • 數據庫:SQL和NoSQL

  • 機器學習和人工神經網絡

  • 深度學習的能力:TensorFlow,Keras和Pytorch


數據工程師 vs 數據分析師 vs 數據科學家

data science team

在基本了解數據科學後,是時侯了解一下這三種主要職位類別中,每種類別所需的技能和不同的角色。

以下將為您說明數據工程師、數據科學家和數據分析師之間的分別:

數據工程師

data engineer

基本職位描述

構建軟件以創建可行的基礎數據結構,從而挖掘新數據、組織原始數據和存儲數據。

重點技能

  • 數據庫系統語言(SQL和NoSQL)

  • 妥善存儲數據的方法

  • ETL工具

  • 資料建模

  • 機器學習

  • 數據API

  • 編程語言(Python,Java和Scala)

數據工程師中的不同角色

  • 機器學習工程師:機器學習工程師是專門研究機器學習模型的人。機器學習工程師更類似於軟件工程師,因為他們會使用數據科學家的分析,並將分析變成可以調配的軟件。

  • 數據庫建築師:這是數據工程的專業領域。數據倉庫建築師負責公司的數據存儲系統,因此數據倉庫建築師必須懂得SQL。您還需要根據企業現有的技術棧(基礎科技架構),去獲得更多其他科技技能

報讀內容豐富 數據工程課程,將能把握在數據工程領域中龐大的工作機會。

數據分析師

data analyst

基本職位描述

分析數據模式及關係,並以數據為其他團隊尋找答案

重點技能

  • 中級結構化查詢語言(SQL)問題

  • 數據清理

  • 數據具象化

  • 概率及統計

數據分析師中的不同角色

  • 業務分析師:專注於分析市場和業務趨勢的數據分析師。這個職位要求熟悉數據分析的軟件,例如Microsoft Power BI。

  • 定量分析師:有時也被稱為「Quants」。這個職位要求使用進階的統計分析技能以提供解答,並做出與財務和風險相關的預測。

  • 系統分析師:通常負責確立企業的問題,然後計劃和監督企業基礎科技架構的變化。

  • 營銷分析師:營銷分析師的任務是透過查看銷售數據,從而評估和提高營銷活動的成效。在數據時代,這些分析師可透過Facebook Analytics或Google Analytics等平台取得更多數據。

報讀內容廣泛的機器學習和數據科學課程,或會在成為數據分析師的路上帶來龐大的機會。

數據科學家

data scientist meeting

基本職位描述

在數據分析師的研究結果中增添創意思維,利用全面的評估報告作出企業的決策或預測。它在職責在很大程度上涉及機器學習。

重點技能

  • 建立和訓練機器學習模型,這些模型可以根據過去的數據做出可靠的未來預測

  • 精通Python或R

  • 有監督和無監督機器學習方法

  • 統計和評估統計模型的能力

  • 了解各種工具,例如MATLAB,Excel,ggplot2,Tableau

  • 熟悉TensorFlow,Keras和Pytorch等機器學習框架

數據科學家具體職務

在此類別中,數據科學家通常是跨行業存在的唯一工作角色。可以有不同的資歷級別,但職位概況保持不變。

在香港報 兼讀制的Python入門課程 數據科學課程,有助踏入數據科學的領域。


另請閱讀: 為什麼PYTHON是數據科學領域必學的語言?


選擇合適的數據科學課程

group-young-business-people-working-office

對於初學者

對於從未接觸這領域的您可能會問:數據科學難學嗎?如何選擇課程?其實課程的選擇取決於您已有的技能和資歷。如果您無法報讀全日制課程,請考慮兼職課程。因為這些課程將會使您更認識數據科學行業情況,並幫助您更了解各種工作的細微差別。

Xccelerate有專門提供給初學者的兼讀制 python入門課程 數據科學課程,以幫助您學習以下類別的基本知識:

  • 初級Python程式員

  • 數據分析師

若您想先從零開始學習所有基礎知識,然後才選擇新的職業,那麼您最好選擇更全面的課程。 Xccelerate 4個月全日制數據科學和機器學習課程非常適合初學者。這些課程不需要任何入讀要求,適合任何想從零開始轉行學習數據科學的人。

完成課程後有許多工作機會,例如:

  • 初級數據科學家

  • 數據分析師

  • 數據工程師

  • 機器學習工程師

  • 商業智能助理

對於具備編程資歷的人

如果您已具備豐富的編程背景,特別是R和Python技能,則可以選擇有強大的職業支援 進階數據科學和機器學習課程。這個數據科學課程有關於領域的專業知識、高級數據科學工具和團隊職業支援。


總結

香港的數據科學正蓬勃發展,這是您投資相關技能的好時機!這些技能可以帶來非常有趣和有意義的職業。由於現時很少著名大學有提供數據科學的專業課程,因此最好的選擇首先完成專上學位,然後再報讀獨立教學機構提供的數據科學課程,例如Xccelerate。

若您正處於職業生涯的分岔路,又需要有人幫助您應對專業挑戰,您可以預約我們的免 一對一職業諮詢,並獲得為您而設的職業建議。


另請閱讀: 10個開始數據科學職業生涯的方法


Career Consultation


Thomas Ho

19 Mar 2021

Accelerating humanity by educating workforces