商業數據分析師的工作內容
2022 Oct 30 專案管理
2011到2022這11年時間裡,作為一位專案經理我管理過時程緊湊的消費性產品;也負責過時程長但開發嚴謹的車用產品。一 直覺得PM是一個讓人燃燒生命但能成長相當多的工作,這是因為這個職位總是強迫PM們必須多想一步,更務實的看待事情,更看懂局。例如專案時程怎麼安排能讓風險降到最小;怎麼和內部同仁或是外部客人、供應商談判;如何在滿足目標的前提下找出大家都能接受的方案...。不過今年(2022) 7月,我決定跨界轉調到經營管理部門成為一位商業數據分析師(Business Intelligence Analyst),主要原因是這個轉換能讓我在管理領域持續深化:商業數據分析師這個職位除了能得到更多數據處理(Excel, Python)與視覺化(Tableau, Dashboard, Report)的的實務經驗之外,管理和思考的範圍更是從一個專案或是一個部門的Scope擴大到一整個BU,這是一個擴展自己能力邊界的機會。
商業數據分析師的工作內容
有價值的商業數據分析師(Business Intelligence Analyst)首先要能透過數據量化的過程讓組織運營的目標與結果成為具體的數字。第二步則是藉由實際數字鋪陳出主管聽得懂的故事,聚焦在關鍵問題上。所謂「戰略是讓自己隨時有得選,然而戰術是選擇之後能贏」。商業數據分析師的目標並不是用數據來証明自己已經做的足夠好(是環境,政策,國際政治...等不可控因素導致差異產生);而是協助組織儘可能地思考不同的策略,並藉由數據來檢驗什麼策略有更高的勝算,擁有更高的主導權。故我們的日常工作主要圍繞在以下幾個方面:
- 分析歷史數據:從已發生的營運數據比對實績值與目標值的差異,找出差異原因做為持續改善的判斷依據給高階主管參考。
- 預測未來結果:從現有資訊中(訂單情況,歷史數據)來預測未來的營運成績。重點在透過持續預測的過程來縮小未來結果與目標之間的差異。
- 推動數據管理專案:改善公司內部數據與資料冶理相關專案,實現數據驅動的目標。
上述第一項(分析歷史數據)是比較單純和Routine 的工作,通常也是初階數據分析師的主要任務,只要熟悉公司的業務活動以及具備Excel,Power Point能力即可勝任。接下來我把分析歷史數據的工作,從數據收集到產生洞見的過程整理如下:
從數據到產出商務洞見
匯整原始數據:
一般來說,為了某個商務目的展開的數據分析工作的第一步會把儲存在不同的資料庫的數據進行匯整。例如: 當我們需要分析公司的獲利情況,除了銷售的訂單數據之外,如果能結合以下資訊,就能用更多的維度來觀察數據背後的意義:
- 產品規格(特徵)資訊: 觀察那些規格的產品銷量好,營收表現高。
- 產品成本數據:觀察訂單的利潤表現。
- 客戶數據:觀察那些客戶貢獻高;男女性別的表現如何?各年齡層的表現。
- 其它維度
若再加上時間因素還可以觀察隨著時間推移,各種商務數據(銷售數量、營業額、平均售價、...)在各維度下的表現。
匯整各資料庫中的數據是數據分析工作的第一步,但因為各類別的數據儲存在不同的資料庫中,一個常見的問題是同樣的資料在不同資料庫中有不同名稱。例如: 銷售數量在訂單系統中可能叫作「銷售量」,在財務系統中叫作「出貨量」,其實指向的是同一個數值,因此在兩個或是多個數據合併時,我們需要先統一各欄位的命名。
數據預處理:
數據預處理的目的在把原始資料中可能造成分析結果失真的數據更正或去除掉讓數據能開始對其進行處理(計算),。通常預處理會有以下幾個步驟:
分類標記(Class Labeling)
把數據儲存成適當的型別: 原始數據可以區分成 2類,即需要被計算的數值數據(Numerical Data),和無需計算的分類標籤(Categolory Data)。在進行數據處理之前,需要先把數據層別出那些欄位是需要計算的數值數據,並且指定合適的格式,例如整數,小數,百分比。
- 數值數據(Numerical Data): 需要被計算且被追蹤的數據,例如每個月的營收,每月新註冊用戶。
- 分類標籤(Categolory Data): 無需被計算,目的是作為觀察觀察數值數據的維度,例如用戶的姓別,學歷;產品規格(例: 產品重量,記憶體容量,螢幕尺吋...)。
數據清洗(Data Cleaning)
數據清洗是對數據進行計算前重要的一步,目的是處理原始數據中數據錯誤或是缺漏的問題,以免造成分析結果失真。所以在分類標記完之後,接著就是確認數據集中的各欄位的數據範圍(最大值/最小值)是否異常,是否存在空值。
- 數據錯誤: 例如某個用戶的年齡被記錄成321歲。
- 數據缺失: 當數據不完整(某些數據是空值)的情況時,例如用戶資料中沒有完整填入資料(例如年齡)。
若是出現以上數據錯誤或是缺失的情況,就要考慮 (1) 把整筆客戶資料刪除或是 (2) 把空值用某數值取代掉,例如把剩餘客戶的平均數(ex:年齡)填入此欄位中。
產出資訊
預處理後的乾淨數據的各欄位再經過處理(加、減、乘、除)之後,我們可以得到度量(Measure),指標(Mertic)以及關鍵績效指標(KPI)。這三者的定義如下:
度量(Measure)
度量(Measure)是單純過去數據的統計結果,例如第一季度的銷售總額是100萬,總訂單數是1,000張。
指標(Metric)
指標(Metric)是具有商務指標的數字,通常會由度量(measure)計算而來,藉由追蹤指標,我們可以了解到運營活動的健康程度。例如可以從上述度量中得到平均每個訂單的金額是1,000元。
關鍵績效指標(KPI, Key Performance Indicator)
KPI在許多指標中有些與商業目標緊密相連結,我們稱為KPI。例如公司每個月的淨利潤總額(Operation Profit Amount),毛利總額(Gross Profit Amount)…。
產出商務洞見
商務數據分析師藉由數據處理的能力以及對業務內容的了解與商務直覺,從各種(Metrics)指標中分析營運活動是否如原本規劃、營運活動是否有潛在的風險。例如2022 第2季整體庫存天數增加,但從客戶維度與時序上發現到主因來自中國客戶從5月份起拉貨動能大幅下滑,所以可以推測這是由於中國從4月底開始的Covid-19 Lockdown 政策導致。再進一步的思考是所有的中國客戶都低迷嗎,需求放緩有地域或是產品線的差異嗎? 我們能做些什麼來改善中國市場的情況呢?如果中國區需求持續不振,最差的情況會是怎樣? 能否要聚焦在其它區域的客人來縮小年度業積和年度目標間的差異?以上都是看到數據後,商業數據分析師可以思考的方向。
以上的資料呈現或是論述會以下面的2種型式呈現:
- 報告(Report):以投影片(Power Point, keynote)型式提出結論,輔以數據、圖表做為論據
- 儀表板(Dashboard):即時監控各項KPI,讓管理層快速聚焦在業務目標上
數據分析師的學習資源
當我們進行歷史數據分析時大致流程就如本文所述,相信只要有基本的Excel操作能力(公式,樞紐分析)和簡報能力就能勝任,不過如果能應用Python語言以及Tableau軟體來進行數據整理以及數據視覺化,就能提高整個數據分析的效率。
另外,當我們需要用數據分析來進行預測未來的工作時,就不是簡單的數據計算了。這裡會用到更多的統計方法(迴歸分析)或是人工智慧/機器學習等工具。對程式語言(Python)的依賴就愈來愈高。以下提供2個我自己這段時間自學數據分析時覺得不錯的線上課程給各位參考,希望能對於有心想成為商業數據分析師、數據科學家的伙伴,或者想精進數據能力的伙伴有所幫助囉 (課程有30天退款保証)。