Translate

Wednesday, September 9, 2015

Machine Learning Last Week!

Andrew Ng 在 Coursera 的 Machine Learning  課程,真可說是一大寶藏。最近看了一些 Deep Learning  的  Projects,  有些地方不太清楚,再回頭看了一下最終回,立馬想通了些道理。

這  Machine Learning 的第十一週課程,有如周星馳的降龍十八掌的最後那招,從天上下來的那一掌,集 Machine Learning 的大成,將理論和實務又巧妙的連接,受益良多。

Machine Learning 首先要作 Pipiline 的規劃,將 Project切成不同階段的  Modules ,大家分工投入,Andrew  第一段影片介紹  Photo OCR Pipeline  ,將如何切菜和分工調理的過程,作了詳實的介紹。




接下來介紹了 Artificial Data Synthesis。這段是 Machine Learning 的精華所在。在選用 Models  時,Features 增加有效降低 Bias,但又會有 overfit  造成 Variance  過大的風險;但這個部份可以用大的資料量來降低 Variance!聽到重點了嗎? 資料量大很重要,重點是,資料有時太少,所以這段教大家如何造資料來 train Algo  , 降低 algo   的 Variance。造資料主要兩個方法,背景多變化和前景歪七扭八化。

最後,又回到 Pipeline 的檢示,分工烹煮,那一道工最值錢?這可不是大廚的  guts feeling  說了算,要有所本。這個章節主要教 Ceiling Analysis如何有所本,同時又贈送了人臉辨識的 Pipeline,實在太划算了。


No comments:

Post a Comment