Andrew.Ng 机器学习笔记 ============================= 啥是机器学习? -------------------- **ETP** :: - Experience - Task - Performance 为了完成某项任务,通过训练,使得机器获取经验,从而达到很好的准确率。 这就好比巴甫洛夫通过不断摇铃,使得狗有了预判接下来有食物吃的能力一样。 那么,在机器学习的过程中,我们应该做什么呢? 我们应该让机器有趋利避害的能力。这样,机器就会在不断的矫枉过正的曲线上趋于稳定。 正如我们练习投篮一样,在不断的练习中,肌肉获取了大概以某种姿势,某种力道就能投进篮球。 啥是监督学习? ------------------------- 这是从经验获取知识的一个过程。 就好比,在无数次看了股票的涨跌之后,我们习得了看见红色就高兴,看见绿色就悲伤的知识。 相反的,对于无监督学习,则是我们没有告诉机器一些已知的结果,他也无从学习,只能天真的把距离近的划为一类,远的划为另一类。 如何选择模型? --------------------------- 这一切围绕 ETP 里的 Performance 进行选择。 既要与现有的经验吻合,又不能太死板(过拟合),不能应付新事物。 所以,选择好的代价函数 或者说惩罚函数是至关重要的。 一般来说,好的代价函数我觉得要有以下考量: - 凸函数 - 统计学的两类错误的权衡 凸函数不会遇到局部最优的情况。 两类错误的权衡,好比是错杀一千还是放过一千的考量。比如说信用卡诈骗和抓捕罪犯对两种错误权衡就不一样了。 .. feed-entry:: :author: Taoge :date: 2017-05-31