找回密码
 注册
查看: 4612|回复: 0

AI科普系列——机器学习 = 模型+策略+算法

[复制链接]
发表于 2020-3-30 17:23:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

x
近年来人工智能、机器学习的热点不断,而在这其中,从某种程度上,“机器学习”更学理的称呼是“统计学习”(statistical learning)。
统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独自的理论体系与方法论。统计学习用于对数据进行预测与分析,特别是对未知新数据进行预测与分析。统计学习对未知数据的预测可以使计算机更加智能化,或者说使计算机的某些性能得到提高;对数据的分析可以让人们获取新的知识,给人们带来新的发现。
统计学习的操作路径具体到监督学习可概括为:从给定的、有限的、用于学习的训练数据(training data)集合出发,假设数据是独立同分布产生的;并且假设要学习的模型属于某个函数的集合,称为假设空间(hypothesis space);应用某个可量化假设空间不同“函数”个体优劣差异的评价准则(evaluation criterion),配置合理的优化算法,从假设空间中选取一个最优的模型,使它对已知训练数据集及未知测试数据在给定的评价准则下有最优的预测性能。
这样统计学习方法包括模型的假设空间、模型选择的评价准则(评估函数或损失函数)以及模型学习的算法(优化算法),称为统计学习的三剑客:1.模型空间;2.评估策略;3.学习算法(如:Grid-Search\Adam\SGD)。


实现统计学习方法的步骤如下:1.得到一个有限的训练样本集合;2.确定包含所有可能的模型的假设空间,即学习模型的几何;3.确定模型选择的准则,即量化模型“好坏”的评估策略;4.确定求解最优模型的优化学习算法;5.模型训练过程:配置模型计算、超参优化的流程,优化算法基于评估策略的量化指标的驱动不同迭代修改模型的超参结构,从而实现模型性能的不断提升;6.模型应用过程:利用训练阶段获取的训练后模型,对位置数据进行预测或分析。
Factor.1 模型确立:选择匹配问题对象的模型方法

关于机器学习等数据驱动的建模手段,业界广泛流传这样一句总结:数据和特征决定了建模效果的上限,而模型(建模方式)和算法(优化学习)则是为了逼近这个上限。数据集的质量和问题特征的重要性不用赘述强调,而模型的选择则关系到是否“对症下药”,如研究对象本身是线性问题,则选择线性回归或多项式回归即可;如研究对象呈现极为明显的非线性倾向,则选择线性回归这类线性模型显然无法提供期望的非线性表达能力,这时神经网络这类具备丰富非线性表达能力的模型,则无疑更为匹配。
所以,模型不存在完美模型,模型只有更适合的模型。深度学习虽然炫酷,但也绝非万能,有的时候,线性回归可能更合适你的问题。


Factor.2 评估策略:量化的不同模型优劣程度的评估指标


工程上常说的一句话:可被测量的问题就是可以被解决的问题。本质上是指具体的目标诉求一旦被转化成有效的量化指标,那么该目标就可以通过具体的手段来达到。哪怕像公司运营管理这么空泛的目标,一旦被转化成KPI这种可度量的指标,并可基于KPI的驱动力来实现运营改善的目标。
同样的道理,虽然建模方法在factor.1中被确定,如一阶线性回归F(x)=ax+b,但不同的a, b对应不同的模型实例,如果不能判别不同模型实例之间孰好孰坏,那么最优模型这一诉求便无法实现。简单地说,评估策略就是评估模型空间两个具体模型间孰好孰坏的量化手段,如线性回归常用的最小化均方误差。
引入评估策略,便可将统计学习问题转化为了最优化问题。最优化问题是借助计算机计算能力最常见的计算任务密集型工作。


Factor.3 学习算法:解决最优化问题的优化算法

流程进行到Factor.2,我们已经将统计学习问题转化成一个具体的最优化问题(最小化损失函数或最大化模型性能评分)。如果最优化问题有显式的解析解,这个最优化问题就比较简单。但通常解析解不存在,这就需要用数值计算的方法求解,如常见的梯度下降方法。如何保证找到全局最优解,并使求解的过程非常高效,就成为一个重要问题。常见的梯度下降、网格搜索Grid-Search、贝叶斯优化等优化学习算法适用于不同应用场景,同样的,这一方向也是近年来AutoML自动化机器学习着重研究的领域。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表