没有免费午餐定理 (No Free Lunch Theorem)
内容:如果我们不对特征空间有先验假设,则所有算法的平均表现是一样的。
我们认为:特征差距小的样本更有可能是统一类。
总结:算法的优劣,与特征空间的假设有关,与具体情况有关。机器学习领域,没有所谓的最好的算法。
机器学习算法种类
- 有监督学习(数据+标签):SVM(支持向量机),神经网络
- 无监督学习(只有数据,没有标签):CLUSTERING,EM算法,PCA
- 半监督学习(数据一部分有标签,一部分没有)
- 增强学习(Reinforcement learning,与上面三个预测标签不同,更关注最后的结果)
根据标签的性质不同分为:
- 聚类(Classification):标签的值是离散的
- 回归(Regression):标签的值是连续的
注意 这两种分类没有特别明显的区别。
About this Post
This post is written by Holger, licensed under CC BY-NC 4.0.