李宏毅机器学习课程笔记——第一章 机器学习介绍

发布于:2022-12-20 ⋅ 阅读:(487) ⋅ 点赞:(0)

 一、机器学习的概念

        首先要明白机器学习的概念。人工智能是个很时髦的词汇,而人工智能的范围很广,包含内容太多。很多人对人工智能,机器学习,深度学习这些概念不清,笔者在这里根据自己的理解来做一个简单的解释。

       人工智能属于一个大的框架,在人工智能的很多方法里,利用程序让机器自主学习的方法我们称为机器学习,而在机器学习中,我们把利用深度神经网络来进行学习的方法称为深度学习。如下图所示。

二、智能

关于智能,简单来说就是不死板,学术点我们叫“鲁棒性”,其实就是灵活解决其他类似问题的能力。我们最容易想到的智能处理方法就是人为地考虑所有情况并把这些情况编入程序,争取做到百密而无一疏,这显然不太正确,因为情况千变万化,根本不可能考虑所有的情况。这一则四格漫画幽默地点明了这个道理。

      其实,我们的真正目标是让机器拥有自主学习的能力。让我们来回顾一下人类是如何学习的。在婴儿时期,我们就会模仿父母的动作。所以学习的本质就是模仿,换句话说我们要想让机器拥有学习的能力,也就相当于让机器学会模仿人类的行为。读者读到这里可能会觉得不可思议,机器怎么会学习呢?其实是我们人类给机器许多例子,让机器从中总结出规律。

三、什么是正确的机器学习方法

      简单来说,机器学习可以相当于让机器求出一个函数,这个函数可以根据我们输入的数据得出相应的结果。

       如图所示 ,我们需要机器做语音识别,这个函数输入的就是一段声音,输出即是结果;同样,我们要求机器做图像识别,输入猫的照片输出的就是图像是猫的结论

       那么,我们如何来找出这个函数呢?

       首先,我们需要一堆函数集合,里面有各种各样的函数,比如一次函数啦,二次函数,三角函数之类的,显然这些简单的初等函数并不能解决我们的问题,这里只是举个例子便于大家理解。

        这个函数的集合我们称为Model,假设里面有f1,f2两个函数,他们对同一个物体识别问题进行处理,得到的结果如图所示,显然f1能更好地解决问题,而f2明显对物体识别错误,就像在五金超市里购买工具,要想知道工具合不合适,最好的办法就是拿着它试一试,能很好地解决问题的工具就是好工具。所以,我们需要事先给出一系列标注好的数据,所谓标注好就是指带有标签的数据,例如,一张小猫的图片加上猫这个标签就属于一组标注好的数据,机器通过输入猫这张图片到函数里,再将结果与标签作比对,发现一样,说明这个工具好使。

     像这种我们给出输入和输出的类型,我们称之为“监督学习”。

     通过这种方法我们可以得到最好的工具,现在该实战环节了,我们用这个工具去解决一些其他问题,看他是不是能巧妙地解决。也就是所谓的举一反三的能力。

四、机器学习相关技术

  1. 监督学习

       我们之前提到过这种类型的机器学习,对于我们人为地给出输入输出这种学习方式我们称之为监督学习,监督学习分两大类问题:回归和分类 。

1.1回归(Regression)

       所谓的回归,就是最后得到的结果是一系列的数字,例如我们需要对明天气温做一个预测,我们可以根据前几天的温度来简单预测一下明天的具体温度,这样得到的结果是数字的形式的叫回归问题。

1.2 分类(Classification)

       回归(Regression)和分类(Classification)的差别就是我们要机器输出的东西的类型是不一样。在Regression中机器输出的是一个数值,在Classification里面机器输出的是类别。假设Classification问题分成两种,一种叫做二分类输出的是是或否(Yes or No);另一类叫做多分类(Multi-class),在Multi-class中是让机器做一个选择题,等于是给他数个选项,每个选项都是一个类别,让他从数个类别里选择正确的类别。例如我们对一个人说话进行测谎,我们可以根据他说话的语气和神态来区分,最后得到好与不好两大类。

      刚才讲的都是让machine去解的任务,接下来要讲的是在解任务的过程中第一步就是要选择function set,选不同的function set就是选不同的model。Model有很多种,最简单的就是线性模型,但我们会花很多时间在非线性的模型上。在非线性的模型中最耳熟能详的就是深度学习(Deep learning)。

        深度学习的函数非常复杂,因此它可以做很多复杂的任务。

        2. 半监督学习

      刚才我们讲的都是supervised learning(监督学习),监督学习的问题是我们需要大量的training data。training data告诉我们要找的function的input和output之间的关系。如果我们在监督学习下进行学习,我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的output叫做label。

       那有没有办法减少label需要的量呢?就是半监督学习。

      半监督学习简单来说就是给出一些没用标注的数据。

       3.迁移学习

        迁移学习就是给一堆没用的数据。

         4.无监督学习

      无监督学习就是一点标签也不给,完全看机器自学

      5.监督学习中的结构化学习

       笔者理解的结构化学习就是要求输出的答案有一定的顺序

   6.强化学习

       强化学习因为人机大战而再度火遍全球,强化学习与监督学习最明显的区别就是,监督学习有正确的数据作为参考,而强化学习完全依靠机器自我修正,自我调节。正如在金庸武侠小说中有一种武功叫做左右手互搏之术,完全依靠练习者自我学习,在不断的训练中找到自己的问题并自我修改。这比较符合人类在社会上的学习情景,没有人告诉你正确答案,你只有在不断地反省去寻求解决办法。

三、总结

  1. 机器学习的本质是求函数
  2. 监督学习、半监督学习、无监督学习的特征是标签数据逐渐减少
  3. 强化学习是依靠机器自我调节而不断强化自身的学习方式
本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到