Join our 5-Day Coding Challenge and Build Your First Ecommerce Website! Learn More Here.

如何成為香港的數據科學家

Steve Safarowic

1 Mar 2019

Click here if you would prefer to read the English version.


強大的數據分析可以幫助公司大幅度地提高決策質量。因此,數據科學家是現在最搶手的職業之一。這不僅發生在科技行業,甚至在比較傳統的企業中亦是如此。事實上,根據 KPMG 的一項調查顯示,現在 81%的企業都依靠分析數據來提高他們對客戶的了解。

以往,香港在數據科學的排名較落後於倫敦,新加坡和矽谷。但是,隨著政府對科技創始公司的推動,香港對數據科學家的需求急劇增加,特別是供應鏈、房地產和金融等行業,對數據科學家的需求正不斷增長。


相關文章:為何DATA SCIENCE對香港如此重要


在數據分析的領域裡,才能是最重要的因素之一。如果一家公司沒有具備擁有結合解決問題能力和技術的數據科學家坐鎮,那麼該公司的分析部門是不會茁壯成長的。這就是為什麼數據科學家是現在最受歡迎的員工之一。同時數據科學家也成了最搶手的科技就業選項。

什麼是數據科學家?

數據科學家是一群具有解決複雜問題能力和具備技術技能的新型數據分析專家 - 他們對於探索那些需要被解決的問題充滿好奇心。

換句話說,數據科學家需要具備:

  • 洞察趨勢的直覺

  • 數學知識以便能理解大量的數據含義

  • 使用電腦的技能,以便可以操作複雜的數據分析工具

數據科學家日益普及,這反映了很多企業對數據的想法已轉變。企業也意識到:他們多年以來所收集到的大量信息現在可以被用成為能提升收入的內幕資訊。

較早前,這個職業僅限於進行統計或基本數據的分析。但是隨著大數據的概念和像 Hadoop 的那樣的大數據處理科技的崛起,這個職業已經演變成數據科學家。一個將創新科技和解難技能結合,並可為企業創造重要成果的角色。

Data Science

數據科學家的職責

數據科學家所扮演的角色可以是多方面的,因項目而異,這就是工作變得有趣和具有挑戰性的原因。以下是數據科學家需負責的主要職責:

  • 與業務和 IT 團隊合作,並使用技術為業務創建解決方案

  • 識別數據中所蘊藏的趨勢,並用它們來創建足以影響公司收入或盈利能力的可實踐見解


相關文章:為什麼Python是數據科學領域必學的語言?


成為數據科學家所需的特質

好奇心

數據科學家會用 80%的時間在於探索和解讀數據。因此,當您在瀏覽大量的數據時,需要時刻保持好奇心和具備提出正確問題的能力。

商業頭腦

數據科學家跨越了 IT 與業務之間的界限。雖然技術和技能是數據科學的基礎,但是一位成功的數據科學家是需要具備強大的商業頭腦。這是因為您需要洞察業務的問題,尋找數據中所隱藏的答案和內幕,從而提供以可實踐的解決方案。如果你對於業務的來龍去脈感到無聊,那麼數據科學可能不是適合您的職業選擇。

合作意願

數據科學家需要根據項目的性質與不同的人群合作。這些項目包括從 CXO 和產品經理到市場和銷售團隊,IT 部門甚至最終客戶。對於那些不喜歡與團隊和不同人群合作的人來說,他可能會很難成為成功的數據科學家。

溝通技巧

僅僅善於理解和解釋數據對數據科學家來說是不足夠的,具備清晰有力的表達能力向決策者解釋他的見解。他們也需要與不同的團隊進行溝通,不同團隊提取所需的信息,一併整合來創造最佳的見解。

Data Science Career

成為數據科學家所需的技能

教育資歷

相關學士學位例如數學、統計學、電腦和工程等,能夠幫助您奠定成為數據科學家所需的基礎。當中也有許多的數據科學家繼續深造,成為專科碩士或博士。這些學位有助您掌握所需的分析技能,讓您的事業發展更加順利。除此之外,您也可以隨時報讀專為入行而設計 短期全日制數據科學和機器學習訓練營,而無需考取一個完整的學位。目前在香港有幾個著名的數據科學課程,例 Xccelerate,能為您提供所需的技術和分析技能,以及就業機會。

Python

Python是數據科學中最常用的編程語言。它是一種非常多元化的編程語言,適用於數據科學過程中的每個階段。從創建任何類型數據以至帶入 SQL 列表都可以用 Python 輕鬆做到。

R 編程

對於新時代的數據科學家,R 是其中一個最好用的分析工具。有 43%的數據科學家都在使用 R。Python 是清理數據和標準化數據的最佳編程語言,而大多數的數據科學家都會使用 R 來對這些數據進行分析。

Hadoop

雖然對於擁有 Hadoop 平台的知識不是強制性的,但它在今天絕對是一項很棒的技能。有一項研究將 Apache Hadoop 列為數據科學家所需的第二重要技能。Hadoop 可幫助您將數據傳輸到系統裡的不同點上。它還有助於過濾數據,數據探索,生成摘要和篩選數據。目前擁有與 Hadoop 類似功能的 Apache Spark 也正在迅速普及。

人工智能 (AI) 機器學習 (ML)

機器學習和人工智能包含許多技能,包括監督機器學習、迴歸樹、神經網絡、計算機視覺、異常檢測等。當然,初始的數據科學家並不需要具備 AI 和 ML 技術的強大知識。然而,鑑於精通 AI 和 ML 的數據科學家為數甚少,所以這是一個脫穎而出的好方法。

Data Science Domain


有關香港數據科學家的常見問題


1. 成為數據科學家需要多久的時間?

要成為一名優秀的數據科學家可能需要一輩子,因為這個領域正在不斷地發展和創新。雖然如此,大多數的數據科學家都認為,要在數據科學方面擁有專業的知識水平需要投入 1 至 2 年的時間。除了基本的技術技能外,您還需要隨著時間的推移建立屬於自己領域裡的專業知識。您可以在 4 至 8 個月內掌握基礎知識,而具體時間則取決於您目前所擁有的技能基礎和您所願意投入的時間。


相關文章:XCCELERATE 故事: 英文科畢業成功轉行軟件開發


2. 剛畢業的人能否成為數據科學家?

只要有穩固的才能和學習的意願,即使是剛畢業的人也能夠成為數據科學家。如果您在數學、計算機科學或工程學相關領域擁有學士學位或高級學位,您可能會找到一個願意培訓您的雇主。

然而,想在香港獲得高薪數據科學工作的最佳途徑就是在香港尋找適合您的數據科學課程,然後從那裡開始您的職業生涯。您也可以找到線下和線上的基礎知識教學。例如,Xccelerate 在數據科學和機器學習方面提 全日制課程 兼職課程。Xccelerate 在香港培訓最優秀的科技人才。

如果你已擁有編程的技能,尤其是 R 和 Python,那麼你可以選擇更進階的數據科學課程,並專注於專業領域的知識和學習使用高階工具。如果您是個新手,那麼從基礎課程開始將會是一個更好的選擇。


相關文章:數據科學難學嗎?


香港的數據科學工作的前景是什麼?

在數據科學工作方面,香港確實落後於美國,歐洲甚至新加坡等亞洲國家。但隨著大數據的爆炸式增長,香港的數據科學工作正在崛起。

由於香港缺乏熟練的數據科學家,所以導致招聘公司會從美國,歐洲和世界其他地區引入。這代表著在香港的數據科學工作崗位上,存在著巨大的供需缺口。因為在香港很少人擁有合格的數據科學家工作資歷。

一名擁有 3 至 5 年經驗的數據科學家預計可以獲得月薪港幣 30000 至港幣 70000 之間今天香港的大多數據科學家都附屬 IT 部門或市場營銷等特定業務部門。預計未來 5 年內,香港的許多公司都會擁有自己的數據科學和分析團隊。香港的數據科學工作的前景在未來幾年會變得更好。

香港哪些行業需要數據科學家?

初創公司

過去幾年在政府的推動下 初創公司在香港如雨後春筍般興起。此外,一些前投資銀行家已經離開了他們高職崗位,出來創辦自己的公司。初創公司是學習和掌握數據科學技能的好地方,因為他們一直不斷在發展。雖然初創公司的薪酬可能無法與成熟公司相匹配,但他們可能更願意僱用他們能在數據科學領域進行培養的人才。

金融

我們已經在之前的文章中介紹 金融專業學習Python)的好處,但在這裡需要再重複一遍。隨著香港與金融業多年來的悠久歷史,以及考慮到世界上大多數金融機構都在這裡設有業務和員工,因此保持競爭力絕對是明智之舉。鑑於這個趨勢蓬勃發展所帶來的好處和高需求,我們特別定制了能應用於金融行業 Python兼職課程

銀行、會計和保險公司

眾多的投資公司和零售銀行,以 四大會計師行都在尋找數據科學家。由於目前市場上缺乏經驗豐富的數據科學家,所以他們不得不重新培訓他們的註冊會計師成為數據科學家。如果您能成為這些公司的數據科學家,那麼你肯定會獲得一個很好的薪酬待遇。另一個擁有大量數據和能夠創造優勢的行業就 保險業。例如富達(Fidelity),友邦保險(AIA)和宏利(Manulife)等公司都能提供很好的薪酬,並且一直都在招聘數據科學家。

酒店業

酒店業正在積極通過數據科學的研究來了解如何優化佔用率和流量。他們能夠給出很好的薪酬,有大量數據可供使用,並且願意投資於尖端技術。

應該報讀哪些數據科學課程?

這在很大程度上取決於您現有的技能基礎。舉例來說,你已擁有編碼的技能,尤其是 R 和 Python,那麼你可以選擇更高級的數據科學課程,並專注於領域專業的知識和學習使用高級數據科學工具。如果您是個新手,那麼從基礎課程開始將會是一個更好的選擇。

接下來,該選擇什麼課程也取決於您可投入的時間性。如果你還是學生或正在找工作,那麼報讀一 全日制課程將會是個好主意。Xccelerate 在數據科學和機器學習方面的全職課程對新手來說是非常有用的。報讀這個課程無需任何的先決條件,並且適合那些想從頭學習數據科學的人。當然,您需要投入 16 週,每週 5 天,每天 8 小時的時間來學習。這個課程也開闢了許多職業,例如初級數據科學家,數據分析師,數據工程師,機器學習工程師和業務分析師(BI)。

如果您已經工作了並且不能參加全日制的課程,那麼您可以考 兼職課程。Xccelerate 有一個數據科學兼職課程,每天兩小時,每週兩次。它可以幫助您找到數據專業人員,初級的 Python 程序員或數據分析師的工作。因此,“剛畢業的人你能夠成為數據科學家嗎?”這一個問題的答案肯定是“能!”。但您必須願意投入時間和精力去學習。

在香港成為一個成熟的數據科學中心之前,我們還有很長的路要走。我們已經看到在過去幾年裡,有關大數據的工作已有很巨大的進步,並且香港對數據科學家更是供不應求的局面 。所以現在是絕佳的好時機來投資學習這些技能,讓自己投入富有挑戰性和高回報的職業生涯。

Xccelerate 數據課程

Steve Safarowic

1 Mar 2019

Accelerating humanity by educating workforces