OpenHarmony啃论文俱乐部方法总结分析

发布于:2023-01-20 ⋅ 阅读:(2) ⋅ 点赞:(0) ⋅ 评论:(0)

目录

引言

目标驱动

方法对比

如何找到感兴趣的领域

论文获取方法

如何进入一个领域

如何找到研究课题

论文阅读方法

实例展示

后记


引言

一提到学术论文,好像是研究生,博士才会涉及到的领域,对于本科生来说,看似有些困难,有些过于专业,好像有壁垒。其实本科生从十几年的“填鸭式”教育方法中一下走进了大学的“放养式”教育,很多同学会感到迷茫,没有目标去支撑自己,OpenHarmony啃论文俱乐部提供了一个很好的平台。我们如果在本科阶段深入一个领域去研究是一件很酷的事情,凭着自己的热爱早早背上行囊,储备知识,在自己最感兴趣的领域厚积薄发,听起来就已经热血沸腾了。

学术论文可以让我们更快的了解自己感兴趣的领域,对该领域技术的发展以及现阶段主流技术和前沿研究有更深入的认识。而系统的学习论文就有助于我们更好的梳理知识网络,理清楚技术之间的关联,找到自己关注的问题进行深入研究。笔者希望通过《台湾清华彭明辉教授的研究生手册 》中提到方法与自己在OpenHarmony啃论文俱乐部中学到的方法的比较,能够得到一些启发,更好的运用在未来的研究领域上。

先附上彭明辉教授方法和OpenHarmony啃论文俱乐部方法的对比图:

下面我们从不同维度对两种方法进行分析。

目标驱动

彭明辉教授站在研究生的角度,期望他们可以通过恰当的方式建立合理的知识结构,掌握独立研究的方法和技能由此学会自己去写论文。而OpenHarmony啃论文俱乐部更多的希望本科的同学从论文学习中提升自己的能力,通过团队的头脑风暴,将见解汇聚成册,将啃论文过程中找到的(优化的)技术更好的运用在OpenHarmony

方法对比

如何找到感兴趣的领域

研究方法有多种多样,无论是什么样的方法,当我们对大多数领域都没有概念时,就需要我们通过大量的去接触相关材料,通过自己所掌握的知识结构找到自己最为感兴趣的领域。

论文获取方法

我们想要进入一个领域,研习众家观点是必然的,那我们有没有一种方法更迅速的能让本科生也可以学会找到自己感兴趣的领域,深入研究呢?

书卷多如浩瀚星海,找到自己感兴趣的领域不是一件易事,我们去哪里找,也是一个很重要的问题。这时候一些专业的网站就派上用场啦,比如知网,百度学术,谷歌学术,万方数据知识平台等等。(ps:美中不足的是上述网站专业但下载文献大多需要付费,对于贫穷的学生党来说很不友好,那当然有很多可以免费下载文献的网站,比如Sci-Hub,等等,很多博主,up主都有整理,大家有兴趣可以去找找看。)

ps:中国知网 网址:https://www.cnki.net/
        百度学术 :https://xueshu.baidu.com/
        谷歌学术 :https://xs.scqylaw.com/

Sci-Hub网站 网址:文献检索-SciHub

如何进入一个领域

当我们想要进入一个领域时,无一例外,需要先了解该领域的技术发展过程及目前该领域的研究方向。彭明辉教授的方法是从这个领域最早的专著或者教材入手,将这个领域的基本概念的内涵及相互关系搞清楚后,再去读这个领域的论文。

而在俱乐部中,大家通常从综述入手,因为综述包含了这个领域的大概内容,发展历程及目前的研究进展,亟待解决的问题。可以让我们更好的从宏观上了解。在我们读综述的时候,会对一些概念理解不清楚或者相互关系梳理不明白的地方,这个时候我们就需要从综述出发,搜集相关资料帮助自己通读整篇综述,这个阶段,我们并不需要完全理解深入综述的每一个部分。而是期望根据综述,形成这个领域的技术地图。

在这个阶段,直接上手专著或者教材理解专业名词的方法刚开始的时候像在看天书,而在ACM Survey等网站上逛一逛,每个领域都可以快速通过综述了解一下,有自己感兴趣的点就深入阅读综述。综述相当于化“找领域,进入领域”两步为一步,对于本科生来说更容易上手。

ps:ACM Survey网址 Advanced Search (acm.org)

类似网站 IEEE网址 IEEE - Communities

如何找到研究课题

当我们了解了整个领域的大致内容,下一步就是找到自己的研究课题。彭明辉教授的方法是找到这个领域尽可能多的论文,先梳理该领域的技术路线,分门别类按照时间排好序。先浏览所有论文,后精读重要论文。一般我们泛读是读一篇论文的精华:摘要(Abstract)和前言(Introduction)部分,有时我们也可以看看文章的结论(conclusions)。

而运用综述的方法会帮我们节省出一部分海量找论文的时间,由于综述会引用每种技术路线中比较经典的参考文献,我们就可以利用这些去形成该领域的技术路线,同时去泛读综述中所涉及的文献。将各种文献分好类别。

两种方法的思路有不同的特点。按照彭明辉教授的思路,我们在浏览论文的过程中需要通过泛读去总结出这一篇或者这个方向的主要诉求、方法优缺点。然后,通过分析,我们找到其中对这个方向研究比较透彻的论文进行深入研究,找到其适用的应用场景,尝试做技术突破。

而利用综述的话,在我们通读综述后,我们已经可以根据综述大致了解每种技术路线的优缺点,这时,我们就可以思考一下,在日常生活中,在什么时间,什么地点,周围有哪些事物的情况下,不同的用户人群需要我们领域中的什么服务,这种服务目前是如何实现的,有哪些优缺点,有什么还没有解决的问题,有没有更好的方法去解决。(即上文所提到的应用场景)。带着这些问题,我们再去看综述,看文献,就会发现,我们想象中的场景,有常用的方案,那么我们就可以直接去翻阅综述中所提到的该方案的相关参考文献。

并且如果我们感觉只看理论可能有点脑袋空空,那我们就可以根据技术地图去开源仓库中先体验一下开源技术,这个过程可以让我们具象对文章所提到的技术有更清晰的认知。我们可以根据开源技术的关键词,找到相关的论文。这个方法可以更容易联想应用场景。

总结而言,彭明辉教授的方法更加注重学术的研究,按照看论文→找场景→找问题→技术突破 这样的路线形成自己的学术论文。而俱乐部的方法则从找综述出发→(通过开源技术)找适用场景→思考会出现的问题→找到具体相关论文→对比找到最适合的技术。综述的方法更多是希望从实用性的角度,做到技术上的更新。

论文阅读方法

前面我们提到泛读一般是看论文的摘要和前言部分,也会去看看结论。精读就要求我们重视论文的主体部分了。

在阅读论文的主体部分时,由于很多论文会只展现成功的案例,展示技术的优点,我们很容易代入文章,跟着作者的思路走,这样就会被迷惑。如果我们带着问题去看论文,就会从更高一层的位置去审视这篇论文有没有解决我们心中的问题,文中的算法有没有改进该技术路线的缺陷。当然,精读也并非要将论文的每一个字,每一条公式都理解透彻,我们不需要拘泥于具体算法或者晦涩的公式理解上,最重要的是了解论文所希望解决的问题和论文中方案的优缺点,总结出亟待解决的问题,看看我们的想法。

实例展示

使用综述的方法可以以我正在看的位置隐私保护这个领域为例:

我在逛ACM Survey时看到了几篇关于位置隐私保护相关的文章,想要去了解这个领域,于是就以Location Privacy,LBS(基于位置服务),Comprehensive Survey等作为关键词,想要找到该领域最新的综述。

于是我们就可以搜索到很多这方面的综述,一般来说,排在搜索第一位的都是比较新且比较权威的文章,但是也不尽然,大家可以多翻阅对比一下。

 

然后我们可以点进去看看文章的摘要部分,了解文章的主要目的。关注这一部分内容能让我们更好的去筛选文章。

 

 我对摘要中所提到的定性和定量的比较很感兴趣,在最初翻阅综述时,我只了解了一点K-匿名在位置隐私保护中的应用,这知道了K这一个隐私度量标准,那有没有其他的标准呢,他们又是在什么样的机制下被提出的?有哪些机制?在什么样的应用场景下可以被应用?这些问题促使我想要更加深层次的了解这篇综述。我就把这篇综述利用sci-hub下载了下来。

这个时候发现文章是全英文的,好像有点头大,没关系,我们可以用知云文献翻译对文章进行翻译。再去看文章会比较轻松一些。

 

整篇综述是比较长的,一般综述都有二三十页,一下子看完好像并不能吸收到很多内容,这个时候利用文章的大标题去形成思维导图就可以让我们的思路更加清楚。在思维导图的基础上可以细化场景形成技术地图。

看到思维导图,大概文章内容我们就很清晰了,这个时候我们再去通读论文就不会那么艰难。在通读论文以后,我形成了几种不同机制对比的表格。

 

下面我就在想,每种机制在不同的应用场景下发挥的能量是不一样的,我对哪个应用场景的位置隐私保护最感兴趣呢?应用场景其实有很多,有的场景一些很专业的团队已经做到很好了,这个时候我就要去找有没有这方面相关的开源技术,能够更好的去体验,迸发新的灵感。

那其实俱乐部更期望我们本科生能够做好“技术洞察”就好,并不一定要在一个领域不断的深入再深入,我们更多的还是可以多去逛一逛ACM Survey这样的网站。有可能在大家逛论坛,看会议纪要的时候会发现不同领域的碰撞。

后记

在我看来,两种方法并没有好坏之分,在我看来,对于本科生来说,通过综述的方法容易上手一些。大家可以根据自己的想法选择适合自己方法,快速上手,在感兴趣的领域闯出自己的一片天地!

当然,我从俱乐部学到的不仅仅是啃论文的方法,还有写文章的过程,我们对每篇综述的输出绝不仅仅只是简单的将英文翻译为中文,复制粘贴即可,而是总结综述中抓到的技术地图,有序的按照降龙十八掌的套路(即发展历程,技术路线,每个板块的场景,问题,技术,开源技术的盘点)进行分析,理解,最后以文本,图表等方式输出。希望我们同学们不仅仅做代码上的强者。

最后,我想说,啃论文是一个长期的过程,我们想要从中有收获,就一定要坚持下来,专注的看论文。