09/12/2021 黃淑儀博士每日財經個人筆記(版權擁有)
今日重點:昨天的頭條就是今天的分析
亞馬遜的雲中斷 (Amazon’s Cloud Outage)
• 亞馬遜的雲計算部門 AWS 停機,停電開始於美國東部時間上午 11 點左右,截至晚上, 導致數千名用戶離線,並影響 Prime Music、Chime 和 Ring 等亞馬遜業務,以及 Ticketmaster 和 Netflix 等第三方應用程序。
• 亞馬遜表示已經解決了許多導致停電的潛在問題,但其他服務仍然存在問題。
• 亞馬遜表示,此次中斷與網絡設備有關,並與應用程序編程接口 (API) 相關,API 是一組用於構建(application programming interfaces)和集成應用程序軟件的協議(protocols)。
停電影響
• 報告中斷導致問題的服務, 包括迪士尼的流媒體訂閱服務、Disney+、Slack、股票交易應用程序 Robinhood 和美國最大的加密貨幣交易所 Coinbase。
• 停電還導致亞馬遜的一些內部服務中斷。 倉庫和送貨工人以及亞馬遜 Flex 服務的司機報告說,他們無法鏈接信息Flex 的應用程序或 AtoZ,因此無法掃描包裹或託運送貨路線。
• 亞馬遜正處於旺季期間,假日購物者紛紛下訂單,這給亞馬遜帶來了確保包裹準時到達的壓力。
對我來說,這是危機管理(crisis management)的一部分。 任何公司,無論大小,理論上應該有應急計劃 (contingency planning), 作為危機管理的重要組成部分. 但往往整個過程中,我們沒有進行深入情景計劃(scenarios planning). 這對我來說是組合的失敗。結果危機擴大,影響更深,中斷時間更長。
儘管危機通常被描述為是不可預測的。 但這真的是真的嗎?
• 有足夠的數據,大多數是可以預測的:可以利用指標(indicators),使用頻率(frequency),構建足夠強大的分析架構(analytical architecture),不斷更新重要相關數據組件(components),了解頻率,搜索設備鏈接點等 (connecting different dots),然後觀察像老鷹 (watch like a hawk):大多數時候我們可以預測危機 。
當然你會問: 你怎麼能預測亞馬遜的雲中斷?
• 讓我從一系列問題來開始, 檢查數據集 (datasets). 這可能有數百甚至數千個問題.
• 什麼會導致中斷的原因? 如果由人為因素 – 內部或外部? 如何發生?如果出於惡意,那麼如何發生在哪裡? 任何案例研究?
• 對我來說:數據就像一顆鑽石,你需要很多技巧來打磨那塊石頭, 才能發現鑽石; 但預測跟數據分析, 有一個很大的不同:一顆鑽石,直到你完成,你才能判斷它的質量是否是世界上最好的鑽石,但是數據,過程是相反的:從一開始,當你看數據的完整性 (data integrity), 你就知道分析的解決方案是好不好。
• 最重要的是精心設計這些問題。大多程度上, 成功或失敗, 取決於準備這些問題。 雖然有規則書,但成功的不僅僅是只靠數據科學家,還需要有那些有商業頭腦、懂一線運營、能跟CEO溝通, 及那些門口保衛士……
• 昨天我講了[小數定律],有了足夠的數據,亞馬遜其實可以減少或避免, 雲中斷停電影響。 因此,牛津大學和劍橋大學的那些科學家可以告訴你 Omicron 下一步會傳播去哪裡,如果是提供數據完整性和足夠的正確數據集。
• 的確,從2021年開始就是數據的十年(The decade of data – I coined this phrase)! 享受發現!
([email protected] <mailto:[email protected]> )