机器学习概论

发布于:2022-12-13 ⋅ 阅读:(463) ⋅ 点赞:(0)

一、什么是机器学习

1、基本定义

        在没有明确设置的情况下,让计算机具有学习能力;让计算机不断学习某一类的问题,然后

利用大量学习的经验从而有基本解决这一问题的能力。

2、学习算法基本分类

        (1)监督学习

                人为教授计算机学习(目的明确,需要给数据打标签,可以衡量效果)。

        (2)无监督学习

                计算机自己学习(没有明确的目的,不需要给数据打标签,无法量化效果)。

        (3)强化学习

        (4)半监督学习

二、机器学习算法介绍(监督学习和无监督学习)

1、监督学习

        (1)定义

                给算法一个数据集,其中每一条数据都包含正确答案,而算法的目的就是给出更多的正

        确答案;

        (2)常见的监督学习算法

                ①回归分析(regression)

                        例:KNN(K-NearesNeighbor)临近算法:对于一个新的数据点,将计算其周围相

                同距离内哪一类的数据点多,就把这个新数据点归为哪一类;

                ②统计分类(classification)

                        例:SVM(Support Vector Machine):找到一个决策边界来将两类样本分开(这

                个决策边界距离两个样本各自最近的样本最远是最好的,这样的边界就叫做超平面);

2、无监督学习

        (1)定义

                输入的数据无标记,也无确定的结果,类别也未知,无监督学习则是没有明确目的的训

        练方式,你无法提前知道结果是什么,根据样本间的相似性对样本集进行分类(聚类),尽

        量做到让类内的差距最小化,类间的差距最大化。

        (2)无监督学习算法的特点

                ①无监督学习没有明确的目的;

                ②无监督学习不需要给数据打标签;

                ③无监督学习无法量化效果;

        (3)无监督学习的常见算法

                ①聚类算法

                        例:K-means:一开始随机选择k个样本作为聚类的中心,然后对每个数据集中的

                数据都计算它到每个中心的欧氏距离,并将其分配到距离最小的聚类中心所属的类别

                中,然后对每个类别都重新计算它的聚类中心,最后重复上面的步骤,直到达到某个终

                止条件就停下;

                ②异常检测

                ③降维算法

本文含有隐藏内容,请 开通VIP 后查看