Andrew.Ng 机器学习笔记
=============================


啥是机器学习？
--------------------

**ETP** ::
	
	- Experience
	- Task
	- Performance

为了完成某项任务，通过训练，使得机器获取经验，从而达到很好的准确率。
这就好比巴甫洛夫通过不断摇铃，使得狗有了预判接下来有食物吃的能力一样。

那么，在机器学习的过程中，我们应该做什么呢？
我们应该让机器有趋利避害的能力。这样，机器就会在不断的矫枉过正的曲线上趋于稳定。
正如我们练习投篮一样，在不断的练习中，肌肉获取了大概以某种姿势，某种力道就能投进篮球。


啥是监督学习？
-------------------------

这是从经验获取知识的一个过程。
就好比，在无数次看了股票的涨跌之后，我们习得了看见红色就高兴，看见绿色就悲伤的知识。
相反的，对于无监督学习，则是我们没有告诉机器一些已知的结果，他也无从学习，只能天真的把距离近的划为一类，远的划为另一类。


如何选择模型？
---------------------------

这一切围绕 ETP 里的 Performance 进行选择。
既要与现有的经验吻合，又不能太死板（过拟合），不能应付新事物。
所以，选择好的代价函数 或者说惩罚函数是至关重要的。
一般来说，好的代价函数我觉得要有以下考量：

- 凸函数
- 统计学的两类错误的权衡

凸函数不会遇到局部最优的情况。
两类错误的权衡，好比是错杀一千还是放过一千的考量。比如说信用卡诈骗和抓捕罪犯对两种错误权衡就不一样了。


.. feed-entry::
	   :author: Taoge
	   :date: 2017-05-31