數據分析學習經驗談 by Dorothee
在10/30(三)晚上的YouTube直播,我分享了自己的數據分析學習之旅
(我知道大家或許懶得看四十幾分鐘的影片重播XD,所以 …)
這次整理成文字版本,分享給大家~
從研究所開始數據分析之旅
我的數據分析之旅開始於研究所時期。那時,我在政大念統計所,開始打工幫老師處理一些民意調查、滿意度調查的案子。我的工作包括問卷資料的輸入、問卷資料分析與報告撰寫,這些經驗為我後來的數據分析工作奠定了基礎。
問卷資料記錄形式
最初的工作是從問卷資料的輸入開始,當時的問卷形式包含紙本和電子兩種。紙本問卷需要人工輸入到 Excel 中,電子問卷則是通過系統直接記錄。
問卷資料的記錄方式主要是以表格的形式呈現。每一份問卷的資料都以一橫列(row)的方式記錄,而每個題目則是一直行(column)。單選題、複選題、開放式題目的記錄方式各有不同,這些不同的形式需要在後續的分析中進行特別處理,例如對開放式題目進行編碼和重新分類。

了解資料是怎麼被記錄的?形式是什麼?非常重要,這是數據分析的第一步。
問卷資料分析工具&流程
當時使用的工具就是Excel 跟 SPSS,用這些工具就可以做問卷資料處理。
一拿到問卷Raw Data資料表後,處理步驟如下:
- 數據清理 Data Cleaning: 拿到問卷資料後,第一步就是進行數據清理。這包括檢查人工輸入的錯誤、處理遺漏值(missing value)、檢查跳題邏輯的正確性(例如回答特定選項應跳過某些題目)等。此外,對於開放式題目的回答,也需要進行重新分類與編碼,以便後續分析。
- 報表製作: 完成數據清理後,接下來就是報表製作。通常會先製作次數分配表,以了解每個題目的回答比例。此外,我們也會進行交叉分析,例如比較不同年齡層或性別的回答差異。如果這份問卷是每年都有做的調查,就會比較歷年的數據趨勢。這些報表能幫助我們深入了解用戶的行為與偏好。
- 撰寫報告: 在完成報表製作後,最後一步就是撰寫報告。報告中除了數據表格,還會使用適當的圖表來呈現資料,例如圓餅圖、直方圖或折線圖,這樣能夠更直觀地展示數據趨勢和用戶行為,並提供相應的洞察。

市調公司時期 - 接觸更多不同的調查類型
我研究所畢業後,就去市調公司工作。有機會接觸到各種不同的市場研究項目,這些案子涵蓋了便利商店、藥廠等企業的品牌研究、員工滿意度調查以及廣告效果測試等不同類型的調查。專案類型不同,但使用的工具、分析的流程基本上跟之前大同小異。
線上影音平台時期:使用 GA 追蹤網站/App 資料
在市調公司工作幾年後,我加入了一家線上影音平台,本來是做使用者研究,後來因為產品上線開始有蒐集追蹤數據,就開始學用Google Analytics GA分析網站數據。最初,公司有請 Google 的顧問來設置 GA 的追蹤系統,而後續的維護和更新由我來負責。
這部分的流程跟之前接觸過的不太一樣…
GA 產品指標分析流程
- 定義追蹤碼規格: 首先,每次產品開發的新功能,都要先搞清楚要看哪些指標?要怎麼定義追蹤碼規格?
當時我們是根據 AARRR 行銷漏斗模型來定義追蹤規格。另外,像是產品部門、行銷部門的KPI不一樣,所以要觀測的指標也會不一樣,這都需要弄清楚。 - 埋設追蹤碼: 定義好追蹤規格後,我會與工程師合作,請前端工程師(包括 Web、iOS、Android)埋設追蹤碼。
- 驗證追蹤碼: 在追蹤碼埋設完成後,我會在測試環境中進行驗證,以確保追蹤碼正確埋設並能夠正確觸發。確認沒有問題後,就會隨著產品功能上線到正式環境。
- 圖表製作: 收集到數據後,就會開始製作圖表進行分析。
GA 平台本身提供了許多即時的數據視覺化工具,可以用來查看各項指標的變化。如果需要更深入的分析,或是將 GA 的數據與其他數據來源結合,我會將數據導出至 Looker Studio 或 Excel,以便進行進一步的整理和分析,並製作更符合需求的報表。這些圖表能幫助團隊和管理層迅速了解新功能的成效,以及用戶的行為趨勢。

多種資料來源的挑戰
除了使用 GA(Google Analytics)的資料之外,我們還有一些產品相關的數據、訂單資料和客戶基本資料,這些資料並沒有全部整合到 GA,而是部分保存在我們自己的資料庫中。
因此,我們面臨的挑戰之一就是如何將這些不同來源的數據取出來,合併、整理後做成視覺化圖表,放在同一張Dashbaord儀表版中,方便大家觀看?
當時我並沒有使用 R 或 Python 來處理這些資料,剛好我同事推薦了一個叫做 KNIME 的軟體。這個軟體的特點是可以在不寫程式碼的情況下進行資料的清理和分析,將不同來源的資料放入 KNIME,進行整理、合併,比如將客戶資料與訂單資料合併,得到更全面的資訊。經過 KNIME 的處理後,將清理好的資料匯出,然後再用 Looker Studio 做視覺化圖表。

結語
- 數據分析新手建議從Excel開始
如果是數據分析新手,本身也沒有學寫過程式(看到程式語法會害怕的…)
Excel 是非常好的入門工具,能讓你理解資料處理的基本概念,例如篩選、排序、樞紐分析等。這些基礎知識對於未來學習更進階的工具(如 Python 或 R)是非常有幫助的,因為它們的許多功能和分析思維都可以在 Excel 中找到雛形。 - 分析前的準備工作
在進行數據分析之前,務必要理解分析的目的、結果應用和後續行動,並熟悉產品、了解使用者行為和公司商業模式。這樣才能清楚知道需要撈取哪些表格和欄位,確保分析的準確性和針對性。這樣才不會花了很多時間做表做圖,但卻無法產出有用的資訊。 - AI 在數據分析中的角色
隨著 AI 技術的進步,數據分析的方式也在不斷演變。AI 工具能在數據清理、報表製作等方面提供極大的輔助,減少我們在重複性工作上的時間投入。然而,AI 無法替代我們對業務的深刻理解。只有真正了解數據背後的業務邏輯,才能有效地運用數據,發掘出潛在的商機,並做出明智的決策。
最後,要來跟大家說個好消息!
大約在12月,我將推出一個全新的 21天數據分析陪練課程。每天只需要15-30分鐘,學習一個處理資料的小技巧,連續21天陪你練習,讓你在短時間內掌握數據分析的核心技巧。
為了更好地滿足大家的需求,我設計了一份課前需求調查表,想聽聽你對課程內容的想法和建議!完成調查的朋友,還可以獲得課程的折扣優惠哦!