當管理碰上資料科學,決策力UP! UP!
編輯撰文者:蔡宜真(UP Tsai);巨鷗科技x跨界策略 專案副理(GEO Informatics Inc., Deputy Project Manager)
管理,無所不在,各行各業都有其專門定義,譬如企業管理、計畫管理、工程管理…等;廣義來說就是『在特定環境中,針對組織資源,有效的計畫、組織、領導和控制,以便達成組織目標的過程』。現代管理學之父彼得·費迪南·杜拉克(Peter Ferdinand Drucker)曾提到『管理是一種工作,它有自己的技巧、工具和方法』;而資訊系統,就是管理工作的輔助工具,下面我們來探討這個輔助工具的趨勢與對管理所產生的效益:
資訊系統趨勢
資訊系統之發展,歷經幾個主要轉變:
1. 資料紀錄的『交易處理系統』:
紀錄業務交易資料,可觀察資料處理過程。
2. 資訊流程的『管理資訊系統』:
資料與資料間利用流程串接,因此可由系統觀察出企業專屬的標準作業流程、方法與規則等。已可做到基礎資料統計與不同屬性間之多維度統計了
3. 知識邏輯的『決策支援系統』:
觀察管理資訊系統資訊呈現之趨勢,透過有規則有邏輯的推理過程,反饋給管理者相關數據與資訊做為決策參考依據。
4. 智慧展現的『人工智慧系統』:
管理資訊系統固然已可以解決所有具邏輯性之問題,在實際管理過程中仍有很多狀況還是得經過專業的人工判斷,而人工智慧系統,則是將這種較無顯性規則邏輯的知識教給機器,訓練機器具備面對不同狀況的應變能力,譬如影音辨識、無人駕駛…等。
資訊系統每個階段的轉變,等同管理工具的升級,相對於管理效益當然越來越高;目前各政府機關與企業普遍具備專屬的管理資訊系統,這些系統多數提供多維度統計分析之功能,讓管理者可依據系統提供之比例、趨勢、總計數…等資訊,做為決策參考依據;注意,這邊講的只是決策參考依據,若系統可以依據過往經驗產生決策方法,對於管理效益的提升更是顯著,兩者之間的關係,可由下圖表現之:
管理不只要統計,您需要的是決策
諾貝爾獎得主赫伯特·西蒙(Herbert A. Simon)曾說『管理就是制定決策』,由上圖趨勢線可以發現,資料處理的程度將影響管理的效益,說明如下(由簡而難):
1. 紀錄資料: 幫助管理者了解發生甚麼事。
2. 統計資料: 由資料趨勢等統計資訊觀察為什麼會發生。
3. 探勘資料: 找出關鍵特徵屬性,協助管理者預測將會發生甚麼事。
4. 訓練資料: 訓練機器可像人一樣思考與行動,做出決策。
上述的資料處理與應用就是我們現今常聽到的『資料科學』,由這四種資料處理程度可以發現,資料必須透過探勘與訓練後才能變成決策,底下將更深入說明如何探勘與訓練。
資料如何變成決策?
如同學習專案管理必須懂得IPECC五大流程,想若想知道資料如何變成決策,就必須了解CRISP-DM(Cross Industry Standard Process for Data Mining)跨產業資料探勘標準作業程序,此程序說明了資料探勘的標準步驟:
1.
1. 了解業務:商業理解包括決定商業目標、形勢評估、決定資料探勘目標,及制訂一個專案計畫。
2. 了解資料:瞭解資料來源是什麼,這些資料來源的特徵是什麼。包括收集原始資料、描述資料、探索資料,及證實資料的質量。
3. 準備資料:將資料來源分類後,需要準備用於探勘的資料。準備過程包括選擇、清理、重構、整合及格式化資料。
4. 建模:這是資料探勘過程中最重要的地方,包含選擇模型技巧、產生測試計畫,及塑模和模型評估,常見的模型有:類神經網路、決策樹、SVM支援向量機、迴歸分析…等演算法模型。
5. 評估:一旦選擇了模型,就應準備好對資料探勘的結果是否達到商業目標作評估。包括評估結果、回顧資料探勘過程及確定接下來的步驟;通常會以準確率來選擇最終使用之模型。
6. 應用:著重於將新知識融會到每天的商業運作過程中,從而解答最初的商業問題。
以國合會技術合作計畫管理系統為例
了解資料探勘的基本流程後,接著讓我們以實際的案例說明:
1. 了解業務、確定目標
國合會技術合作處所掌管的業務為友邦國家依據國家發展策略與目標,擬定以「能力建構」與「技術移轉」為核心之技術合作計畫,藉由技術培訓或經營輔導…等具體方法,協助夥伴國克服技術缺口以提升生活水準;
該處每年有近百筆執行中計畫需管理,因此『計畫管理系統』為該處主要之管理工具,提供各計畫經理管理計畫預算、計畫範疇與計畫時程,經由執行人員的進度填寫掌握各計畫進度。
假設在計畫管理各階段,計畫可行性評估是讓計畫經理們花最多的時間評估的階段,那麼我們可以做一個在計畫研擬階段提供決策者該計畫可行或不可行(Go/NoGo)之模型,用以節省決策者可行性評估的時間。
2. 了解資料
有了『計畫可行性決策模型』明確目標後,接著我們必須了解跟計畫相關的資料資源有哪些?並且思考甚麼樣的計畫是可行?甚麼樣的計畫是不可行?該從哪些面向的資料決定?
3. 準備資料
假設我們估計可以從”執行進度”、”預算支出”、”駐外技術團”…等面向的資料表現做出分析,需將這些資料彙整後將資料屬性轉換為可分析之格式、並清理異常資料…等資料預處理。
4. 建模
這個階段建議使用至少三個以上的演算法模型,以取得準確率之交叉比對;本階段我們會先將資料拆成兩份,一份為訓練資料(約占全部資料80~90%)、一份為測試驗證資料(約占全部資料20~10%),在建模階段,我們使用的是訓練資料,在訓練模型的過程中,必須不斷的調整特徵參數,來取得準確率最高的參數模式。
5. 評估
在評估階段會將測試驗證倒入已完成訓練的預測模型中,比較每個模型的準確度,最後保留準確度最高的模型做應用。
6. 應用
模型產生後,則可依據找出之關鍵特徵因子讓使用者輸入後,由預測模型產出Go/NoGo之決策。
結論
一個好的資料探勘系統,需考量幾個因素:
- 需要有大量資料,資料量與訓練模型的準確度有著對等關係,資料量越大模型準確度越高。
- 特徵因子會隨著時間而改變,因此預測模型必須不斷的訓練、測試、調整參數,以確保維持或提升模型準確度。
近幾年大數據、資料科學急速火紅並且被應用到各個不同領域,然而在2017年9月的哈佛商業週刊”管理,比科學更重要”文章中提到了『用資料做決策,會有局限。其實,過度倚賴科學分析,往往會窄化策略選項,阻礙創新。』
因此,如何在資料科學與管理決策間取得平衡,將是管理者下一步該思考的課題。