什么是PYTHON机器学习的非监督学习

什么是PYTHON机器学习的非监督学习?谈到非监督学习,它和监督学习的区别在于训练集中是否有人为设定的标签。人为设定标签一定是建立在人对事物有了解的基础之上的,但在许多实际应用中,对事物的了解都是从无知到认知的,对于很多事情开始并不知道数据的类别,也没有训练样本进行类别的划分。要从这些没有被标记的数据集中通过机器学习算法进行分类器设计,需要通过数据之间的内在联系和相似性将它们分成若干类。比如对动物如何划分科目纲,在最初的时候,一定是考虑动物相关数据之间的内在联系和相似性,这就用到了非监督学习。非监督学习会用两种方法去考虑
种是基于概率密度函数估计的方法,通过分解各个类别的概率密度函数,再将每个类别划分到特征空间,用相关的机器学习算法设计分类器。
另一种是基于样本间相似度间接聚类的方法,把每一个样本都看成一个类别,给定两个样本相似度的计算方法,进而计算两个样本的相似度,把相似度最大的类进行合并,再计算新的类与类之间的相似度,直到把相似的所有样本合为一个类
无论是基于概率密度函数估计的方法,还是基于样本间相似度间接聚类的方法,它们的逻辑分析方法都是一致的。

监督学习和非监督学习都需要相应的机器学习算法去解决问题在后面的章节中会重点介绍PYTHON机器学习的相关算法,这也是解决监督学习和非监督学习问题的关键。

wechat

扫码咨询,领取88折扣