人机交互技术(HumanComputer Interaction,HCI)是21世纪信息领域需要发展的重大课题。例如,美国21世纪信息技术计划中的基础研究内容定为四项,即软件、人机交互、网络、高性能计算。其目标就是要开发21世纪个性化的信息环境。其中,人机交互在信息技术中被列为与软件技术和计算机技术等并列的六项国家关键技术之一,并被认为“对计算机工业有着突出的重要性,对其他工业也很重要”。美国国防关键技术计划不仅把人机交互列为软件技术发展的重要内容之一,还专门增加了与软件技术并列的人机界面这项内容。
01、人机交互的发展历史
1959年,美国学者B.Shackel从人在操作计算机时如何才能减轻疲劳的角度出发,发表了被认为是人机界面的第一篇关于计算机控制台设计的人机工程学的论文。1960年,J.C.R.Licklider首次提出人机紧密共栖(HumanComputer Close Symbiosis)的概念,被视为人机界面学的启蒙观点。1969年,在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业《国际人机研究杂志》(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。
1970年,成立了两个HCI研究中心: 一个是英国Loughbocough大学的HUSAT研究中心; 另一个是美国施乐(Xerox)公司的Palo Alto研究中心。
1970—1973年,学术界出版了四本与计算机相关的人机工程学专著,为人机交互界面的发展指明了方向。
20世纪80年代初期,学术界相继出版了六本专著,对最新的人机交互研究成果进行了总结。人机交互学科逐渐形成了自己的理论体系和实践范畴的架构。在理论体系方面,人机交互学从人机工程学独立出来,更加强调认知心理学、行为学和社会学的某些人文科学的理论指导; 在实践范畴方面,从人机界面(人机接口)拓延开来,强调计算机对于人的反馈交互作用。“人机界面”一词被“人机交互”取代。HCI中的“I”,也由“Interface”(界面/接口)变成了“Interactive”(交互)。
自20世纪90年代后期以来,随着高速处理芯片、多媒体技术和Internet Web技术的迅速发展和普及,人机交互的研究重点放在了智能化交互、多模态(多通道)—多媒体交互、虚拟交互以及人机协同交互等方面,也就是放在以人为中心的人机交互技术方面。
人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。它经历了以下几个阶段。
1. 早期的手工作业阶段
当时交互的特点是由设计者本人(或本部门同事)来使用计算机,他们采用手工操作和依赖机器(二进制机器代码)的方法去适应现在看来十分笨拙的计算机。
2. 作业控制语言及交互命令语言阶段
这一阶段的特点是计算机的主要使用者——程序员,他们可采用批处理操作或交互命令语言的方式与计算机打交道,虽然要记忆许多命令和熟练地使用键盘,但已可用较方便的手段来调试程序、了解计算机执行情况。
3. 图形用户界面阶段
图形用户界面(Graphical User Interface,GUI)的主要特点是桌面隐喻、WIMP技术、直接操作和“所见即所得”。由于GUI简明易学减少了使用键盘,实现了“事实上的标准化”,因而使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群,它的出现使信息产业得到了空前发展。
4. 网络用户界面的出现
以超文本标记语言(Hyper Text Markup Language,HTML)及超文本传输协议(HTTP)为主要基础的网络浏览器是网络用户界面的代表。由它形成的WWW已经成为当今Internet的支柱。这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、网络加速、多媒体动画、聊天工具等。
5. 多通道、多媒体的智能人机交互阶段
以虚拟现实为代表的计算机系统的拟人化和以手持计算机、智能手机为代表的计算机的微型化、随身化、嵌入化,是当前计算机的两个重要的发展趋势,而以鼠标和键盘为代表的GUI技术是影响它们发展的“瓶颈”。
利用人的多种感觉通道和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,可以提高人机交互的自然性和高效性。多通道、多媒体的智能人机交互对我们来说既是一个挑战,也是一个极好的机遇。
02、人机交互的研究内容
1. 人机交互界面表示模型与设计方法
一个交互界面的好坏,直接影响到软件开发的成败。友好人机交互界面的开发离不开好的交互模型与设计方法(Model and Methodology)。因此,研究人机交互界面的交互模型与设计方法,是人机交互的重要研究内容之一。
2. 可用性分析与评估
可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。人机交互系统的可用性分析与评估(Usability and Evaluation)的研究,主要涉及支持可用性的设计原则与可用性的评估方法等。
3. 多通道交互技术
多通道交互(MultiModal Interaction,MMI)是近年来迅速发展的一种人机交互技术,它既适应了“以人为中心”的自然交互准则,也推动了互联网时代信息产业(包括移动计算、移动通信、网络服务器等)的快速发展。
MMI是一种使用多种通道与计算机通信的人机交互方式。通道(Modality)涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如语音、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉、味觉等。采用这种方式的计算机用户界面称为多通道用户界面。MMI的各类通道(界面)技术中,有不少已经实用化、产品化、商品化。其中,我国科技人员做出了不少优异的工作。
多通道交互主要研究多通道交互界面的交互模型、多通道交互界面的评估方法以及多通道信息的融合等。多通道信息整合是多通道用户界面研究的重点和难点。
4. 智能用户界面
智能用户界面(Intelligent User Interface,IUI)的最终目标是使人机交互像人人交互一样自然、方便。上下文感知、眼动跟踪、手势识别、三维输入、语音识别、表情识别、手写识别、自然语言理解等都是认知与智能用户界面需要解决的重要问题。
5. 群件
群件(Groupware)是指帮助群组协同工作的计算机支持的协作环境,主要涉及个人或群组间的信息传递、群组中的信息共享、业务过程自动化与协调,以及人和过程之间的交互活动等。目前与人机交互技术相关的研究主要包括群件系统的体系结构、计算机支持交流与共享信息的方式、交流中的决策支持工具、应用程序共享以及同步实现方法等内容。
6. Web交互
Web交互(Webinteraction)重点研究Web界面的信息交互模型和结构、Web界面设计的基本思想和原则、Web界面设计的工具和技术,以及Web界面设计的可用性分析与评估方法等内容。
7. 移动界面设计
移动计算(Mobile Computing)、无处不在计算(Ubiquitous Computing)等对人机交互技术提出了更高的要求,面向移动应用的界面设计问题已成为人机交互技术研究的一个重要应用领域。针对移动设备的便携性、位置不固定性和计算能力有限性以及无线网络的低带宽/高延迟等诸多的限制,研究移动界面的设计方法、移动界面可用性与评估原则、移动界面导航技术,以及移动界面的实现技术和开发工具,是当前的人机交互技术的研究热点之一。
随着计算机技术的发展,计算机功能也越来越强。随着模式识别,如语音识别、汉字识别等输入设备的发展,操作员与计算机在类似于自然语言或受限制的自然语言这一级上进行交互成为可能。此外,通过图形和数据可视化进行人机交互也吸引着人们去进行研究。这些人机交互可称为智能化的人机交互。这方面的研究工作正在积极开展。
03、人机交互的前景
人机交互技术领域热点技术的应用潜力已经开始展现,如智能手机配备的地理空间跟踪技术,应用于可穿戴式计算机、隐身技术、浸入式游戏等的动作识别技术,应用于虚拟现实、遥控机器人及远程医疗等的触觉交互技术,应用于呼叫路由、家庭自动化及语音拨号等场合的语音识别技术,对于有语言障碍的人士的无声语音识别,应用于广告、网站、产品目录、杂志效用测试的眼动跟踪技术,针对有语言和行动障碍人士开发的“意念轮椅”采用的基于脑电波的人机界面技术等。人机交互解决方案的供应商不断地推出各种创新技术,如指纹识别技术、侧边滑动指纹识别技术、压力触控技术等。热点技术的应用开发既是机遇也是挑战。基于视觉的手势识别率低、实时性差,需要研究各种算法来改善识别的精度和速度,眼睛虹膜、掌纹、笔迹、步态、语音、唇读、人脸、DNA等人类特征的研发、应用也正受到关注,多通道的整合也是人机交互的热点,另外,与“无所不在计算”“云计算”等相关技术的融合与促进也需要继续探索。