人机交互

人机交互
人机交互

人机交互技术是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话、交换信息的技术。人们可以借助键盘、鼠标、操作杆、位置跟踪器、数据手套等设备,用手、脚、声音、姿态和身体的动作、视线甚至脑电波等向计算机传递信息;计算机通过打印机,绘图仪、头盔式显示器、音频等输出设备或显示设备给人提供信息。

目前,人机交互技术正处于多通道、多媒体的智能人机交互阶段,已经取得了不少研究成果,不少产品已经问世。侧重多媒体技术的有:触摸式显示屏实现的“桌面”计算机,能够随意折叠的柔性显示屏制造的电子书,从电影院搬进客厅指日可待的3D显示器,使用红绿蓝光激光二极管的视网膜成像显示器;侧重多通道技术的有:“汉王笔”手写汉字识别系统,结合在微软的Tablet PC 操作系统中数字墨水技术,广泛应用于Office/XP的中文版等办公、应用软件中的IBM/Via Voice连续中文语音识别系统,输入设备为摄像机、图像采集卡的手势识别技术,以IPHONE手机为代表的可支持更复杂的姿势识别的多触点式触摸屏技术,以及IPHONE中基于传感器的捕捉用户意图的隐式输入技术。

人机交互技术领域热点技术的应用潜力已经开始展现,比如智能手机配备的地理空间跟踪技术,应用于可穿戴式计算机、隐身技术、浸入式游戏等的动作识别技术,应用于虚拟现实、遥控机器人及远程医疗等的触觉交互技术,应用于呼叫路由、家庭自动化及语音拨号等场合的语音识别技术,对于有语言障碍的人士的无声语音识别,应用于广告、网站、产品目录、杂志效用测试的眼动跟踪技术,针对有语言和行动障碍人开发的“意念轮椅”采用的基于脑电波的人机界面技术等。热点技术的应用开发是机遇也是挑战,基于视觉的手势识别率低,实时性差,需要研究各种算法来改善识别的精度和速度,眼睛虹膜、掌纹、笔迹、步态、语音、唇读、人脸、DNA等人类特征的研发应用也正受到关注,自然语言理解虽然目前在语言模型、语料库等方面有进展外,仍将是人机交互的重要目标,多通道的整合也是人机交互的热点,另外,与“无所不在的计算”、“云计算”等相关技术的融合与促进也需要继续探索。

人机交互技术与计算机始终相伴发展,CPU、GPU的运算能力日趋强大,网络和通信技术的快速发展,显示技术的重大突破都将为人机交互提供新的起点与高度。也许有一天,你的房间的墙壁和窗户都是基于PLED技术的巨型显示器,无需遥控器和控制器,游戏机或电视机就能“感应”到你目光的变化、捕捉到你的手势和动作、听懂你语音的命令,用你的头、手、足、躯干就可以控制游戏中

的角色。互联网正在向“云端”计算时代发展,人机交互的发展仍将延续由以计算机为中心的复杂交互向以人为中心的简单、自然交互转移的理念,理想的人机交互模式就是“用户自由”,将来,能听、能看、能说、能感觉的计算机会看不见,而计算会无所不在,不可见的人机交互也会无所不在,就像我们时刻呼吸着的氧气一样。

多媒体时代的人机交互

语音识别

在计算机进入到多媒体时代后,新的人机交互方式又涌现而出。语音识别便是一种。这种交互方式在生活中已经随处可见。在今天人们使用的手机上早已可以利用语音执行操作,不仅如此,手机甚至还能合成语音输出结果。

在当前流行的计算机中,稍微高端一点的手机,基本都有语音控制的功能,通过语音控制,人们只需要对着手机说出通讯录中的人名,手机便会自动拨号。手机上的其他功能也可直接用语音说出指令进行操作。但是受手机运算性能所限,想要通过语音实现短信的文字输入,仍未完全实现。

手机的体积非常小,输入和输出设备都非常不便,另一方面利用声音进行人机交互的方式几乎不用学习就能很快上手,因此语音输入被认为是最好的人机交互方式,并且代表了未来的趋势。因此本文在开篇之时,用了大量文字论述手机的广泛应用。

2007年4月20日,比尔盖茨在英特尔开发者论坛上表示,未来语音识别技术将彻底取代键盘。他的理由是在未来人们将会越来越习惯通过语音和指控屏来与计算机交流,而不是通过键盘,因为这种方式更加简便。在随后的一次演讲中,他说:“这(语音识别技术)是我们最大的赌注之一。”

事实也的确如此,微软早在其刚被淘汰不久的操作系统Windows XP中便已将语音识别技术集成了进去,由于并未进行大力宣传,因此大多数用户并不知道。

虽然在计算机上实现文字的输入却早已实现,可是局限性也同时存在。大约在2001年的时候,我和几个朋友在无意间获得了一款I BM的语音识别软件,那个软件的名字叫“Via Voice”。通过这个软件,在经过简单的适应性训练之后,便可以对计算机实现各种控制,还能输入文字,如果发音足够标准,输入的准确率将非常高。但我和小伙伴们在新鲜几天后,便发现这个东西其实并不使用,甚至非常麻烦。

中国人常说某人口才或者文笔好的词语是:出口成章。意思是某人说出来的话,非常连贯,不需要修改便是一篇很好的文章。口才好的人永远是少数,绝大多数人无法做到出口成章,至少我不是这样。在写本文的时候,每一句都在写作的同时修改。如果用鼠标配合键盘对文字进行修改,我很清楚,知道应该如何操作,但是如果想用语音识别技术,仅用语音去控制计算机进行文章的修改将是非常繁琐的事情,因为我必须说诸如:“将鼠标移动到……”之类的话。而且在文字输入的过程中,计算机将可能难以识别操作者的部分语音控制命令的真实意图,例如关键字“删除”、“关机”和“取消”等。

语音识别技术所面临的问题绝不是仅此而已。还有更多问题仍是语音识别技术所面临的问题。

例如隐私问题,人需要控制计算机就需要发出声音,而计算机输出语音也会发出声音。在今天,人们越来越重视个人的隐私,但是用语音进行人机交互,除非是在个人私密的环境下,否则很难保护个人隐私。

想想看,在一个几百人办公的大办公室内,所有人都对着计算机说话,那将是一件多么滑稽的事情,而且话说多了,其实也是一件非常劳累的事情,至少将会使人口干舌燥。

因此,在未来,语音识别想要彻底取代键盘,成为最主要的人机交互方式,可能性不大。他最多只能是现有鼠标加键盘人机交互方式的补充而已。

霍金的轮椅眼睛控制鼠标

史蒂芬·威廉·霍金是当今最著名的科学家,他在理论物理领域有深入研究,被认为可以与爱因斯坦齐名。霍金在21岁的时候患上了“肌肉萎缩性脊髓侧索硬化症”,该病症很快便导致他全身瘫痪,从此轮椅相伴、痼疾缠身。

也许正是由于其身患残疾,因此不会被外界干扰,所以才获得举世瞩目的大量科学成就。为了能够让霍金与其他人交流,专家们制造了一块拼写板,帮助霍金和其他人交流。交流时,需要有一位人指着英文字母,当指到霍金所要的字母时,就会扬起眉毛,逐个拼出词汇然后连成句子。这样交流方式的速度可想而知。

后来美国加利福尼亚一位名叫的瓦特·沃尔托兹电脑工程师帮霍金走出了困境。他送给了霍金一段自己编写的名为“平等器”的电脑程序,这个程序可以让霍金从屏幕上选择词汇,只要他按动手中的开关,单词转入语言合成器发出声音来。后来,剑桥调节通讯公司的大卫·梅森又改进了这套设备,并安装在了霍金的轮椅上,使霍金“说话”的速度大大加快,每分钟可“说”出15个词,如果需要还可以把文字直接打印出来。

我们可以发现,霍金的这种选词方式与鼠标的区别不是很大,后来随着霍金病情的加重,连手指也不能动作了,无法再用手控制计算机,只好依靠其他方式与人沟通。于是科学家们在霍金的眼镜上,大约距右颊一英寸的地方,安装了一块可以侦测肌肉活动的红外线发射器及侦测器,当霍金想打招呼,说“Hello”时,眼球控制红外线感应器,选定在荧幕上轮流出现的英文字母,当屏幕出现他想要的“H”时,霍金再动眼球,这样计算机就会不断显示以“H”为字头的英单词,当“Hello”出现时,他只要再动一下便可以选定“Hello”,然后接着选

择下一个单词,在整句话完毕后,计算机便会将霍金用眼球控制计算机造出的句子传至合成器发出发声。

霍金这种用眼球控制计算机的技术也被用在了其他更多方面,例如日本佳能公司生产的高端相机就可以利用眼球来控制相机的对焦点。

我们在使用自动对焦相机拍照的时候都知道,在相机里有一个对焦点,当我们在拍照的时候需要把这个对焦点对准目标,然后轻按快门,相机便会完成自动对焦,接着将快门按到底便可完成整个拍照过程。

我们需要用手动调整相机里的对焦点到合适的位置才能拍照。可是美丽往往只在瞬间,因此经常发生等调好了对焦点,精彩的瞬间已经永远流逝。或者来不及调整对焦点,当按下快门后,冲洗出来的照片却发现是虚的。

如果能从取景框里看到什么,相机便自动以眼睛所看的目标为对焦点,那多好?佳能公司早在生产EOS 5的时候,便满足了人们的这一需求。该款相机可以依靠其独特的仿生构造,依靠眼睛控制来控制自动对焦功能。在EOS 5中的取景目镜下方装有四个红外线发光二极管,发出红外线对向取景器窥视的人眼照射,再通过目镜与五棱镜之间的分束镜和聚焦透镜,将反射光投影在一块6千像素的CCD 面传感器上。机内的CPU对眼球像瞳孔的中心和角膜表面反射光的成像的对位置进行运算,得出眼球的回转角度,从而得到拍摄者的视线投向取景器中的位置,然后选择最为接近的自动对焦框,并以此为主要聚焦点进行自动对焦。简单来说就是拍摄者的眼睛在取景框中看着什么目标时,相机便会自动将其作为对焦的焦点。

这种功能对于新闻摄影尤其适用,因此很多专业的摄影记者,特别是体育记者都会使用佳能的这个功能更方便的在瞬间对焦,摄影记者只需要在取景器里看着目标,相机便能瞬间知道拍摄者正在注视的目标完成自动对焦,而无需先调整焦点才能按下快门。

这种用眼睛进行定位的技术也早被使用在了战斗机飞行员的头盔上,当飞行员想要攻击目标时,只要看见目标,瞄准系统便会自动锁定。

这种使用眼睛进行目标选定的功能,在未来如果用到计算机上将会非常适用。既然我们的眼睛总是跟着鼠标的光标而移动,为什么不能让光标自动跟着人的眼球移动呢?当我们用鼠标的时候,便只剩下一只手去操作键盘了。你能用单手敲击键盘吗?显然效率会降低很多,既然这样为什么不用眼睛来控制鼠标。将我们的双手解放出来呢?这将是多么方便的一件事情啊!既然如此,相信在不远的将来,这项技术将会被应用在计算机上。

今天当我们使用计算机时,必须输入密码,除非你并不重视个人隐私。在许多场合,我们需要对自己的身份进行识别,乘飞机需要身份证,开车需要驾照,取款需要银行卡,这些都是对我们身份进行识别的过程,这种识别都需要被识别人凭借一定的物理介质和密码。在未来,通过互联网远程身份对比和生物识别技术结合,将会有很大改进。

指纹识别

前几天,我在北京报名学车了,惊异的是,驾校竟然采用了指纹识别。据称,这是为了避免有的人蒙混过关。因此,相关部门规定学员在上课前和每天学完规定的汽车驾驶课后,都必须用指纹进行签到确认。

不用我多说,你应该知道世界上没有2个人的指纹是相同的。

不过遗憾的是,我第一次去采集指纹的时候却不是那么顺利。我站在队列的中间,在我之前有很多人前去采集指纹,有的人比较顺利,能很快被成功采集,有的人则经过数次采集也无法成功,这时我暗自嘲笑,怎么这么笨呢?我的笔记本上采集指纹就非常容易啊。不会这么难的。

很快轮到我采集指纹了,比我预想的要糟糕很多。和其他大多数人一样,我竟然采集了十余次都失败了!

我有这么笨吗?

于是我拿开手指,仔细观察了一下指纹采集器,一个红色的透明玻璃板。我突然回想起,当我在笔记本上进行采集时,是将手指滑过一个大概0.3x2CM的扫描设备。但如果只是将手指按在玻璃板上,只能采集到我手指的一小块指纹,因此将无法全部采集到。如果我将手指放上去,然后滚动按压指纹是否可以被顺利采集到呢?

和我预想的一样,我的指纹被成功采集了。我愉快的将这个小发现告诉了所有人。事后我想为什么那个指纹扫描设备不能使用凹陷下去呢?但截止目前还没见到过这样的设备。目前想要扫描一个立体的图形,技术成本仍然很高,而且这种采集设备的价格也非常昂贵,被广泛使用仍需要较高成本。

尽管指纹识别的准确率仍不是非常高,但仍有很多地方采用了这项技术,例如在门禁系统上,人们可以使用指纹进行安防识别,进行上下班的考勤。

在金融系统,这种技术已经得到了成熟应用,例如2007你那,北京的农村商业银行率先开通了一种名为“金凤凰网银”的业务,是首家被中国银监会批准“使用指纹识别数字证书技术进行客户身份识别的网上银行”

这个系统使用了一个指纹识别设备,将指纹和银行卡账号相匹配,使用者在登陆网上银行的时候,只需使用指纹进行身份识别后便可登陆网上银行。

不仅如此,指纹识别的技术还被使用到了自助缴费终端上,只需使用指纹对自己身份进行识别便可以进行缴纳水、电费,办理转账及预约存、取款等交易。这种身份识别系统还被应到了ATM自动柜员机上,从此再也无需携带银行卡便可以在ATM机上凭指纹存、取现金了。

更方便的是,在上海的一些超市,人们已经甚至可以不必携带银行卡,直接使用指纹进行购物时候的货币支付了。

已经被广泛应用的指纹识别系统也是人机交互的一种方式。自从有了指纹识别,我们不用再记住复杂的密码了,在需要身份识别的地方只需要手指往上一按便可

以了。不过这种技术显然无法取代键盘或者鼠标,他只能成为人机交互系统的辅助识别系统。

尽管指纹识别很方便,但到现在我仍更喜欢使用密码,因为我很担心自己如果手指脱皮会不会使笔记本再也不认识我了。

事实上,指纹识别系统并不十分安全,我们在美国影片《国家宝藏》中便看见指纹很容易便被他人复制并且使用。

比指纹更安全的是虹膜识别,他是利用人眼中的视网膜进行识别。

虹膜识别

虹膜这个名词你一定不会陌生,不过可能有少部分人仍不知道虹膜到底是什么。它其实就是我们用肉眼所能看到的眼球的那一部分,虹膜的中心有一圆形和眼球其他部分不一样颜色的开口,称为瞳孔,犹如相机当中可调整大小的光圈,里面的色素决定了眼睛的颜色。

人类眼睛的虹膜与手指纹一样,是独一无二的。因此,英国剑桥大学的约翰·多曼博士才有机会发明了虹膜身份测定技术。

一个虹膜大约有266个单位的读取点,而其他传统生物测定技术只能读取13-16个单位。因此虹膜识别技术要更加精确,另外由于虹膜技术相比较起指纹,不容易被复制,因此防伪性能更好。

但是指纹和虹膜识别都有一个缺陷,需要人直接接触或者靠近识别设备,并且要做短暂停留,因此在使用上仍然有一定局限性,在某些场合并不十分适用。

人脸识别

大概在2年前,我前往人民大会堂开会的时候,无意间发现了一种人脸识别的设备,他可以通过摄像头将人的脸部拍摄下来,然后和存储中的相片进行比对,以确定其真实身份。这种识别技术显然要比指纹和虹膜识别的技术要快速和方便很多。

人的眉骨、鼻梁、颧骨等都是人面部骨骼的基本结构,在这个三角区能构成无数个集合图形,每个人的骨骼会有不同的细微差别,因此每个人在该区域构成的几何图形都不一样。这便是人脸识别系统的技术原理。即使是人变胖或者变瘦几十斤,甚至变得依靠肉眼都无法辨认出来,由于人的骨骼不会发生变化,因此仍能被人脸识别系统敏锐的“目光”发现。

在已经召开的2008年北京奥运会上,这种人脸识别技术得到了更广泛适用。据说在北京奥运会期间,出入各比赛场馆的任何人都会被人脸识别系统拍下脸部画面和系统中的可疑人物进行对比。该系统可以从人群中快速辨认出可疑人物,以防止其进入敏感区域。只要可疑人物经过摄像头下方,无论乔装打扮成什么样子,只要被拍摄到其1/5以上的面部信息,便可以显示出被拍摄者的详细信息。

在该系统中,将有10多亿人的信息被存储到奥运场馆人脸识别系统数据库。届时奥运会时每个比赛场馆安装的探头数量将达数百甚至数千个,并全部和这套人脸识别系统相连,以确保奥运会安全。

在奥运会上,这套人脸识别系统为平安奥运做出了巨大贡献。

姿势识别

在北京首都机场1号航站楼,一楼至二楼的楼梯旁边有一个使用投影做的互动游戏。这些游戏都是通过人的身体动作来控制。例如在玩足球游戏的时候,投影中会有一个足球的影像被投到地面,人只要用脚触碰到画面中的足球,便能像真实生活中踢足球一样控制足球移动。

这便是姿势识别的一种。不仅如此,姿势识别也能像指纹和虹膜一样,进行身份识别,据科学家的研究说,这种技术可以达到80%-95%的识别率。其实,我们在生活中,也经常能通过他人走路的身影分辨出是谁。这是因为,每个人走路的姿势都会有所不同,有的人走路时总是昂首阔步,有的人则会拖着脚走,还有的人走路却总是显得软弱无力。所以科学家们正在开发一种安全系统,使计算机扫描人走路姿势扫描,再加上其它的生物学统计技术如对面部和眼睛或者指纹的识别技术,从而有效的辨别他人的身份。

触摸屏技术

在今天,触摸屏技术的使用范围已经非常普遍。特别是在手机中的使用,更是非常广泛。苹果公司推出的iPhone手机由于大量使用了触摸屏技术,酷酷的人机交互界面令人耳目一新,使其迅速被用户广泛推崇。

有了触摸屏技术,人们可以用手指在电脑屏幕上直接操作,而无需鼠标。人们只需要将指尖直接碰触需要按的位置,便可按照操作完成操作。

触摸屏技术使手指彻底代替了鼠标,甚至有的触摸屏利用模拟在屏幕上显示键盘的方式直接代替了键盘,例如iPhone手机便在其手机屏幕上模拟了一个键盘,用户只需要使用手指的拇指前端触摸屏幕,便可完成文字的输入。

尽管iPhone手机的屏幕很大,但当使用指头触碰键盘的时候,由于手指比目标按钮区要大许多,因此经常会发生输入错误的现象,在进行中文输入时,错误率更高。

许多人认为这是iPhone手机设计的一大缺陷,但在其2008年6月推出的3G版iPhone手机中并没有对该问题进行改进,因为在许多早已经使用了触摸屏技术的手机上都被另外配备了一支笔,这使用户可以使用笔进行跟准确的定位,有效降低了错误率。

目前常见的触摸屏有:电阻、电容、红外线和表面声波等几种技术原理。

电阻触摸屏的主要部分是一块与显示器表面配合非常紧密的电阻薄膜屏,这是一种多层的复合薄膜,由一层玻璃或有机玻璃作为基层,表面涂有一层叫ITo的透明导电层,上面再盖有一层外表面硬化处理、光滑防刮的塑料层,它的内表面涂有一层导电层(ITO或镍金),在两层导电层之间有许多细小(小于十分之一英寸)的透明隔离点把它们隔开绝缘。当手指触摸屏幕时,两层导电层在触摸点位置就有了一个接触,控制器侦测到这个接通并计算出X、Y轴的位置,进行定位。

电容技术的触摸屏是一块四层复合玻璃屏,和电阻触摸屏原理类似,玻璃屏的内表面和夹层各涂有一层ITO(纳米铟锡金属氧化物),它有很好的导电性和透明性,在屏幕的最外层还有一个0.0015毫米厚的矽土玻璃作为保护层,夹层中的ITO涂层便是工作面,屏幕的四个角上会引出四个电极。

当用户在用手指触摸电容屏时,由于人体本身具有电场,因此手指头和工作面会形成一个耦合电容,工作面上的高频信号会被手指头吸收走一部分很小的电流。这个电流分别从触摸屏四个角上的电极中流出,流经这四个电极的电流与手指到四角的距离成比例,控制器可以通过对这四个电流比例的精密计算,得出触摸点的位置。

苹果iPhone手机使用的便是这种技术,因此当用户在使用触摸屏的时候,只能用手指头,连指尖都不行,手指头的面积较大,因此就不能准确定位了,但是这种定位技术却非常迅速和精确,只是iPhone手机的屏幕太小。

红外触摸屏是利用X、Y方向上密布的红外线矩阵来检测并定位用户的触摸。通常红外触摸屏在显示器的前面安装一个外框,靠藏在外框中的电路板在屏幕四边排布红外发射管和红外接收管,一一对应形成横竖交叉的红外线矩阵。用户在触摸屏幕时,手指就会挡住经过该位置的横竖两条红外线,从而判断出触摸点在屏幕的位置。

表面声波是超声波的一种,他是在在介质(例如玻璃或金属等刚性材料)表面进行浅层传播的一种机械能量波。表面声波性能稳定、易于分析,并且在横波传递过程中具有非常尖锐的频率特性。

表面声波触摸屏的触摸屏部分可以是一块平面、球面或是柱面的玻璃平板,安装在CRT、LED、 LCD或是等离子显示器屏幕的前面。这块玻璃平板只是一块纯粹的强化玻璃,区别于别类触摸屏技术是没有任何贴膜和覆盖层。

玻璃屏的左上角和右下角各固定了竖直和水平方向的超声波发射换能器,右上角则固定了两个相应的超声波接收换能器。玻璃屏的四个周边则刻有45度角由疏到密间隔非常精密的反射条纹。因此可以进行准确定位。

触摸屏技术在未来,将被越来越广泛的使用,当仍只是目前的传统人机交互方式的补充。

平板电脑和Windows7

2002年,微软公司和数家硬件公司合作,推出了一种全新用户体验的计算机:平板电脑(Tablet PC)。但过高的价格使其并未被广泛普及,虽然微软的合作伙伴们均生产了平板电脑,但价格却是同一时期内的最贵笔记本电脑。

平板电脑,实际是预装了微软Windows XP Tablet PC版,使用触摸屏技术的笔记本电脑。他的核心技术是数字墨水技术。使用这种电脑,人们可以直接在电脑屏幕上进行绘画,或者按照自己平时书写文字的习惯写字,电脑会将书写的笔迹完全记录保存下来,并可以在最后整理。

平板电脑的这种使用方法,其实并不陌生,因为在高档手机之上,我们早已熟练使用。 iPhone的流行,使人们对触摸屏的技术更加感兴趣,第一次发现原来触摸屏可以这么好玩。

平板电脑,虽然具有触摸屏技术,但是在本质上仍是一款传统的电脑,外观上最大的区别是,屏幕可以进行180度的翻转,使用户更方便的在触摸屏上,用电磁笔进行文字书写。但这样使用电脑触摸屏,手指总会在屏幕上留下指头的痕迹,甚至不小心将屏幕划伤。大多数的时间中,人们仍然是在桌子前,因此键盘仍然是平板电脑不可缺少的必须配件。

微软即将在2010年推出的windows 7操作系统中,已经将触摸屏技术全面引入操作系统,微软预计到那时候,由于成本下降,计算机的运算速度也将越来越快,触摸屏技术将成为计算机特别是笔记本的标准配置。

在今天,当我们站在大屏幕前演讲时,只能借助激光笔对重要的内容进行圈点,控制PPT的翻页。许多演讲人在兴致高时,总会站在大屏幕前,直接对PPT的内容,用手进行指示,但会挡住投影的内容,非常不便。

在显示器可以被做的越来越大的今天,触摸屏更易在展示中起到作用,例如中国中央电视台的世界周刊节目就将这种触摸屏技术应用到了节目的演播之中。节目中,主持人可以用手指随意拖动、放大、缩小或者选取图案和素材,展示给观众。这种全新的节目表现方式令观众耳目一新。

人与机的对话——浅谈人机交互的人机关系及其发展趋势

2009-03-11 10:27:23| 分类:IT |字号订阅

摘要

人机交互作为一门独立学科,带来了与传统媒介大不一样的传播方式的革命,人们开始充分利用它的交互性创造用户与计算机之间的"有意义”的联系。本文依据人机交互的发展现状,通过新旧媒体与人的关系对比分析,体现出新媒体在互动方面的优势,预测人机交互的发展趋势,展望未来人机交互的发展前景。由于技术的提高及设计的人性化,未来人机交互将综合多种技术,界面自然,操作简便并应用在生活中的各个领域----人机互动,将无处不在!

关键词:人机关系

以人为本

多通道互动

智能互动

引言

随着科技的不断发展,计算机的出现引发关于“人机交互”的研究已经有半个世纪的历史。从最早的二进制大型计算器到现在的虚拟现实,如今全世界的高科技领域精英们都在为人机交互的发展和前进不屑努力,且已经使人机交互走向了更广阔的应用空间。本文通过简要的回顾,和计算机这种新媒介与传统媒介的对比,分析人机关系,并基于目前科技的发展现状展望人机交互的发展前景。

一、人机交互概况

1、什么是人机交互?

当今,关于人机交互的研究已经成为世界上的一大潮流,关于人机交互的讨论也随处皆是,那么,到底什么是人机交互呢?简单的说,就是人与计算机的互动,科学的说,人机交互CHI(Computer Human Interaction) 是一门跨学科的研究,国际上也称(HCI,Human Computer

Interaction),它的研究内容很广,包括心理学领域的认知科学,心理学;软件工程领域的系统构架技术;信息处理领域的语音处理技术和图像处理技术;人工智能领域的智能控制技术等。

总的来说,人机交互本质上是认知过程,人机交互理论是以认知科学为理论基础;人机交互系统是一个闭环系统,人机交互研究是以系统科学作为人机交互研究的框架的方法学;同时,人机交互是以信息技术作为用户界面的技术基础,通过信息系统的建模、形式化描述、整合算法、评估方法以及软件框架等信息技术最终实现和应用人机交互理论。[引自北京大学计算机系人机交互与多媒体研究室简介]

2.人机交互的发展历史

人机交互是随着科技的不断发展而发展的,自从计算机出现以来人机交互技术经历了巨大的变化。总体来看,它是一个从人适应计算机到计算机不断的适应人的发展史:

(1)人适应计算机

早期的手工作业阶段,计算机是现在看起来十分庞大笨拙的二进制计算机,使用者既设计者必须使用计算机代码语言和手工操作的方法。作业控制语言及交互命令语言阶段,计算机的主要使用者(程序员)可以通过记忆许多命令和敲击键盘,采用批处理作业语言或交互命令语言的方式来调试程序、了解计算机执行情况。

(2)计算机适应人

到了图形用户界面(GUI)阶段,由于可以直接操纵而无须掌握复杂的计算机语言,不懂计算机的普通用户也可以熟练地使用,大大的拓宽了用户群,使信息产业得到空前的发展,计算机适应人的序幕正式拉开。科技进一步发展,网络用户界面的出现增强了人机交互,基于超文本标记语言HTML及超文本传输协议HTTP 为主要基础的网络浏览器是网络用户界面的代表,由它形成的WWW网已经成为当今Internet的支柱。同时新的技术不断出现:搜索引擎、网络加速、多媒体动画、聊天工具等都使人机交互上升到一个更高的境界。多通道、多媒体的智能人机交互阶段是真正人机交互的开始。当前计算机的两个重要的发展趋势是计算机系统的拟人化和计算机的微型化、随身化、嵌入化。如虚拟现实、手持电脑、智能手机等。单纯视觉通道的交互方式已向多通道交互方式转变,人机交互已经更为人性化,操作亦向自然、高效的方向发展。

二、人机关系

人机交互是在两者之间(无论是生命体还是机器)连续作用和反应的过程。交互性是人际领域和传播媒介的基石,也无疑是我们文化的关键点之一。它使人类沟通浸染了媒介最显著的特色——时间和空间的无穷变异性[1]。勿庸质疑,人机交互的核心就是交互性,它决定着人与机的关系。和传统的媒介相比,计算机和人产生的交互更为深入广泛,那么我们就来分析一下新旧媒介和人的交互关系有何异同:

1、传统媒体与人的关系:

所谓传统媒体既报纸、杂志、电视、电话等信息传播媒介。就以报纸为例来看,如图一所示,信息的传播者甲将信息A发布于媒体,当乙接触到媒体便成为信息A的接收者,接收者再对信息做出反馈B(如读者来信选登等)通过媒体反馈给甲,此时便完成了一个交互的过程。整个过程中,传播与反馈的信息都是定量的而非变量。那么,在这一过程中媒体的两边是信息的发出者和接受者,媒体就像一个桥梁连接二者,这种连接可以是跨越时空的。既,发出者和接受者可以处于不同的空间,同时或不同时完成交互过程;亦可以处于相同的空间在相同或不同的时间里完成此过程。但是传统媒体是有一定局限性的。它不是一种实时的交互,有时甚至只有单方动作的发出而没有受众接收后的反馈渠道,严格意义上讲不成为互动,即使有也不是实时的,这是传统媒体本身的局限性。从本质上来讲,这种交互其实是人与人之间的互动,媒体只充当被利用的承载工具,并没有与人发生交互。

人与机的对话——浅谈人机交互的人机关系及其发展趋势- dhp_blog - dhp_blog的博客

2、新媒体与人的关系:

新媒体主要指基于计算机技术的新形式媒介,它除了具有传统媒介所具有的跨越时空性,更大的特点是具有智能性和交互双向性。新媒体的交互可分为两类:一是与传统媒体本质上没有区别的交互形式,如网站、网络聊天、电子邮件等,只是换了一种媒体而已,本质还是人与人的交互,分析同上;另一种是人机双向交互,如网络游戏、脱机游戏、电子宠物、虚拟现实等,媒体不再是单纯的承载工具,而变成为交互的主体:以网络游戏为例,如图二所示,当设计者甲设计好一个软件既传达一种规则A给计算机和玩家乙,一旦玩家乙对计算机产生动作X,一个人与机的对话就开始了(此时甲成为一种前提存在而不参与到互动中来)。由于计算机的智能性可以对动作发出者的行为做出智能运算并做出反应,出现的结果是设计者和使用者都未知的。当乙动作于计算机,计算机通过智能运算,形成了新的信息并针对乙发出的动作X做出反应Y,乙接受到的已经不再只是A,而是由A和X共同作用下产生的智能化的结果——变量Y。乙收到Y后的反馈为X’,它是由A,X,Y共同作用的结果;计算机对X’的反应为Y’,如此往复形成一系列有传承关系的交互。当媒体和乙再反馈给设计者甲时,甲收到的是分别来自媒体和乙的反馈B、C,当他将B、C总结应用到开发新一代软件时他变成了甲’,投入使用后将出现媒体’和乙’形成新一轮的交互。值得注意的是,甲变为甲’是在第一重人机交互过程反馈后的第二重人机关系,是具有时间性的。总的来看,这个交互的过程中甲和乙是分别和媒体交互的,媒体已经跃升为交互的一方和人的关系是平等的,都是交互的主体。

人与机的对话——浅谈人机交互的人机关系及其发展趋势- dhp_blog - dhp_blog的博客

综合来看,传统媒体的交互本质是人之间的交互,人与媒体的关系是不平等的利用与被利用关系,传递的信息量是定量;新媒体的交互在传统媒体交互上又发展了一步,其本质是人与计算机之间的交互,人与媒体的关系是平等的,它反映的不是交流双方的主客体关系,而是一种“等同关系”:机器不仅仅是工具,也是我们社会的积极参与者[2]。

三、人机交互的发展、变化

1、以人为本

前面我们已经简要回顾过人机交互的发展历史,人机交互和计算机用户界面已经渡过了基于字符方式的命令语言式界面的阶段,目前正处于图形用户界面时代,将来的发展趋向于以人为本的自然和谐的交互。人机关系中计算机对人的互动(既图二中计算机对人的动作反应——变量Y)将被更加发扬光大,交互形式将利用人的多纬度感知开发出多通道同时作用的人性化交互,以及交互中非精确语言既模糊语言的运用,实现真正意义上的人机交互。

2、多通道互动

由于技术方面输入设备键盘、鼠标的限制,具有高效交互性的多通道媒体交互还不能普及,人机的交互也多在此划开了分界(如图一和图二所示),但在很多领域,工程师和设计师们已经做出多方探索,使人们看到了高效的自然人机交互的曙光。我们已经看到,基于人的感觉(如视觉可看可注视,手可控制、可触及等)开发的效应通道的出现和应用。如视觉方面的视线跟踪系统,目前外国部分科学家已经利用这种技术研究受测者的心理,相信在不久的将来这会不只应用于心理学研究,甚至可以取代鼠标在界面上简便、直接、快捷的选取感兴趣的信息;听觉通道可以利用三维听觉定位器(3D Auditory Localizer)、分贝感应器、语音识别系统、声音与画面相互转化;触觉方面的感光、感压技术为实现自然交互界面提供更多可能。意大利蓝色工房的艺术作品中就有较多运用,如“是什么触动了我”,当人走在可以感应光影的屏幕上会触动屏幕里躺着的人翻身扭动(图三、图四)。带有触摸屏的手机和电脑就是利用感压技术实现的。它的好处是使用户避免了生硬不自然的、频繁耗时的通道切换从而提高自然性和效率。现在,还有一些利用人的其他生理现象实现的的交互形式,比如脉搏、心脑电波、出汗、肾上腺素等。笔者见过的一个中国艺术家的互动作品既是采用医用测脑电波仪捕捉两名游戏者的脑电波,第一关是谁的脑电波强度越大,屏幕里相应颜色的荷花就开的越多,直到开满屏幕进入下一关,谁先钓到指定数量的鱼谁就胜出,游戏既结束。它运用的就是将脑电波用图象来表现的技术,从而形成了一个有趣的游戏。而现在出现的智能健身器就是在脉搏感应记数等方面开发的互动产品。

前些年有科学家利用仪器捕捉到一种由人脑发出的微粒,研究成果表明人的大脑在思考时会发出一种极其微小的微粒(远小于原子),可以在瞬间移动到数公里以外,而敏感的人会对这种微粒做出反应,如打喷嚏或出现说曹操曹操到的现象(实际上是曹操将要来A地,思想微粒先于他到,敏感的人接收到这种讯息就谈到曹操,在谈的过程中曹操正好赶到)。笔者认为当技术发展到一定程度,捕捉这种思想微粒就像捕捉手机信号一样容易时,我相信结合以上几方面的技术利用三维显示界面的虚拟现实技术,人机交互的操作将是更随意、更简便、更自然、更广阔的发展空间。

人与机的对话——浅谈人机交互的人机关系及其发展趋势- dhp_blog - dhp_blog的博客

3.智能互动

自从深蓝的胜利打响了人机大战的第一炮,智能计算机的研究就更加紧锣密鼓的进行着,人机现场和奏即兴乐曲业已实现,人机交互的发展已经又深入一步。人工智能的研究无疑加大了人机互动的步伐。人工智能产物已经服务于各行各业,人们开始希望人工智能产物可以设

计的更具有人的特点,期待我们的创造物——人工智能产品可以主动与我们发生更人性化的智能交流。也有人担心人工智能一旦具有了人的特点如情绪、心智等心理特征将会存在与人的可控制范围之外,甚至反过来控制人类。但无论怎样,技术的发展推动着人机关系的发展,人机交互必将向更深层面的交互发展并存在于人类生活的各个角落已是一个必然的趋势,人机的互动将无处不在!

结论

综上所述,正如图一与图二直观的对比出新媒体较传统媒体之间的差别,传统媒体只是简单的传递信息,极具互动性的新媒体则是在人机对话过程中又有新信息产生,人的体验也会比接触传统媒体更加丰富、直观、有趣味,机与人的关系更为密切化、平等化,它能达到的交互效果是传统媒体难望其项背的,亦是前人不敢想象的。这就是为什么新媒体从出现以来就在短短的半个世纪里迅速使长久以来传统媒体在人们生活中的主体位置受到威胁,且越来越被更多的人接受的原因了。无疑的,新媒体有更大的互动潜力可以挖掘,我们可以大胆的想象将来人机交互的样子,也许想象中奇异的情景有一天真的会被高速发展的科学技术实现。其实由于人的智慧是一种不恒定的变量,那么由变量创造出来的变量就更是不可预知的了,但可以肯定的一点是人机交互将成为未来生活中必不可少的一部分,并逐渐扮演更重要的角色。

[参考书目]

[1](美)Nathan Shedroff.Experience Design(M).Indiana:New Riders Publishing.2001.

[2](美)巴伦·李维斯,克利夫·纳斯著卢大川等译. 媒体等同(M).上海:复旦大学出版社.2001.p213.

新型人机交互接口电路的设计

摘要主要介绍了TI公司的新型的16位超低功耗Flash型h6N30F44X系列单片机的结构、特性和功能及液晶显示器LCD的发光原理和类型,讨论了该系列单片机与ILD及键盘的人机接口电路的设计方案和相应的软件的实现方法,最后给出它在体内电刺激器的应用实例。 关键词单片机;MSP430;LCD;人机交互接口 1引言 在当今的各种实时自动控制和智能化仪器仪表中,人机交互是不可缺少的一部分。一般而言,人机交互是由系统配置的外部设备来完成,但其实现方式有两种:一种是由MCU力口驱动芯片实现,如键盘显示控制芯片SK5279A,串行数据传输数码显示驱动芯片MAX7219等等,这时显然MCU没有LCD的驱动功能。另一种就是MCU本身具有驱动功能,它通过数据总线与控制信号直接采用存储器访问形式或I/O设备访问形式控制键盘和LCD实现人机对话。这里的MCU主要有世界各大单片机生产厂商开发的各种单片机,其中TI公司的MSP430系列因其许多独特的特性引起许多研究人员的特别关注,在国内外的发展应用正逐步走向成熟。 2LCD简介 LCD(Liquid Crystal Display),即液晶显示器。液晶显示是通过环境光来显示信息的,它本身并不发光,因而功耗很低,只要求液晶周围有足够的光强。LCD是人与机器沟通的重要界面,早期以显像管(CRT/C athode Ray Tube)显示器为主,但随着科技不断进步,各种显示技术如雨后春笋般诞生。LCD由于具有轻薄短小、低耗电量、无辐射危险、平面直角显示以 及影像稳定不闪烁等优势,逐渐占据显示的主流地位。 LCD的类型,根据其分类方式的不同而不同。如根据LCD显示内容的不同可以分为段式LCD和点阵L CD。根据LCD驱动方式的不同可以分为静态驱动和多路驱动。 3MSP430F44X简介 MSP430F44X系列是TI公司最新推出的具有超低功耗特性的Flash型16位RISC指令集单片机[2]。该系列单片机性价比相当高,在系统设计、开发调试及实际应用上都表现出较明显的优势。它主要应用在各种要求极低功率消耗的场合,特别适合用于智能测量仪器、各种医疗器械、智能化家用电器和电池供电便携设备产品之中。 3.1系统结构 MSP430F44X的系统结构,主要包括:CPU、程序存储器(ROM)、数据存储器(RAM)、FLL+时钟系统(片内DCO+晶体振荡器)、看门狗定时器/通用目的定时器(WatchDog)、ADCl2(12位A/D)、比较器A(精确的模拟比较器,常用于斜边(Slope)A/D转换)、复位电压控制/电源电压管理、基本定时器(Basic Timerl)、定时器(Timer-a和Timer-B)、LCD控制器/比较器(多达160段)、硬件乘法器、I/O口和串行口[4]。系列中各种具体的型号稍有差别。在本次设计中,具体选择MSP430F449作为人机接口电路的设计具有许多独到的优势。这一点,读者可以根据TI公司相关的数据手册进行比较。 3.2片内外模块特性 MSP430F44X具有丰富的片内外围模块,其明显的特点是:具有48条I/0口线的6个并行口P1-P6,其中P1、p2具有中断能力,同时具有2个可用于UART/SPI模式选择的串行口(USART0和USARTl);内含12位的A/D转换器ADCl2,快速执行8×8、8×16、16×16乘法操作并立即得到结果的硬件乘法器;多达160段的LCD控制器/比较器,可以实现多种方式的驱动显示;可以实现UART、PWM、斜坡ADC 的16位Timer-A和16位Timer-B;非常灵活的时钟系统,既可用32768Hz的钟表晶振产生低频时钟,也可以用450kHz-8MHz的晶体产生高频时钟,同时还可以使用外部时钟源或者用不同控制频率的DCO;多达几十kB的Flash空间,这样数据既可以保存在片内的Flash信息存储器,也可保存在程序的Hash中的剩余空间。 4接口电路设计 4.1接口电路简图及说明 典型应用电路示意图。在该图中,LCD类型和键盘种类及数目的选择、下拉电阻的数值大小都必须认真

回顾:人机交互中的手势的可视化解释

本科毕业设计(论文) 外文参考文献译文及原文 学院机电工程学院 专业数字媒体技术 年级班别2008级(1)班 学号3109000746 学生姓名李林钢 指导教师冯开平 2013年6 月

目录 译文:回顾:人机交互的手势的可视化解释 (1) 1 引言 (1) 2手势建模 (3) 2.1定义手势 (3) 2.2手势分类 (5) 2.3 手势的暂时性模型 (5) 2.4空间建模手势 (6) 3手势分析 (7) 原文: Visual Interpretation of Hand Gestures for Human-Computer Interaction: A Review(见同名文献) .................................................. 错误!未定义书签。 1 INTRODUCTION .......................................................................... 错误!未定义书签。 2 GESTURE MODELING ................................................................ 错误!未定义书签。 2.1 Definition of Gestures .......................................................... 错误!未定义书签。 2.2 Gestural Taxonomy ............................................................... 错误!未定义书签。 2.3 Temporal Modeling of Gestures ........................................... 错误!未定义书签。 2.4 Spatial Modeling of Gestures ............................................... 错误!未定义书签。 3 GESTURE ANAL YSIS ..................................................................................... 错误!未定义书签。

人机交互发展历史

人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。交互的信息也由精确的输入输出信息变成非精确的输入输出信息。 一、简单的人机交互界面 由于受到制造技术和成本等原因限制,早期的人机交互在设计上较少考虑人的因素,一味强调输入输出信息的精确性,因而使用不够自然和高效。 1.早期的手工作业。 当时交互的特点是由设计者本人(或本部门同事)来使用计算机,他们采用手工操作和依赖机器(二进制机器代码)的方法去适应现在看来是十分笨拙的计算机; 2.作业控制语言及交互命令语言。 这一阶段的特点是计算机的主要使用者—程序员可采用批处理作业语言或交互命令语言的方式和计算机打交道,虽然要记忆许多命令和熟练地敲键盘,但已可用较方便的手段来调试程序、了解计算机执行情况; 3.图形用户界面(GUI)。 GUI的主要特点是桌面隐喻、WIMP技术、直接操纵和“所见即所得(WYSIWYG)”。由于GUI简明易学、减少了敲键盘、实现了“事实上的标准化”。因而使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群。它的出现使信息产业得到空前的发展; 4.网络用户界面。 以超文本标记语言HTML及超文本传输协议HTTP为主要基础的网络浏览器是网络用户界面的代表。由它形成的WWW网已经成为当今Internet的支柱。这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、网络加速、多媒体动画、聊天工具等; 二、自然的人机交互界面 随着网络的普及性发展和无线通讯技术的发展,人机交互领域面临着巨大的挑战和机遇,

传统的图形界面交互已经产生了本质的变化,人们的需求不再局限于界面的美学形式的创新,现在的用户更多的希望在使用多媒体终端时,有着更便捷、更符合他们的使用习惯,同时又有着比较美观的操作界面。利用人的多种感觉通道和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,使人们从传统的交互方式的束缚解脱出来,使人们进入自然和谐的人机交互时期。这一时期的主要研究内容包括:多通道交互、情感计算、自然语言理解、虚拟现实、智能用户界面等方面。 (1)多通道交互 多通道交互(Multi Modal Interaction,MMI)是近年来迅速发展的一种人机交互技术,它既适应了“以人为中心”的自然交互准则,也推动了互联网时代信息产业(包括移动计算、移动通信、网络服务器等)的快速发展。MMI是指“一种使用多种通道与计算机通信的人机交互方式。通道(modality)涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如言语、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉或味觉等”。采用这种方式的计算机用户界面称为“多通道用户界面”。目前,人类最长使用的多通道交互技术包括手写识别、笔式交互、语音识别、语音合成、数字墨水、视线跟踪技术、触觉通道的力反馈装置、生物特征识别技术和人脸表情识别技术等方面。 (2)情感计算 让计算机具有情感能力首先是由美国MIT大学Minsky教授(人工智能创始人之一)提出的。他在1985年的专著“The Society of Mind”中指出,问题不在于智能机器能否有任何情感,而在于机器实现智能时怎么能够没有情感。从此,赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著“Affective Computing(情感计算)”中提出并给出了定义,即情感计算是关于情感、情感产生以及影响情感方面的计算。 MIT对情感计算进行全方位研究,正在开发研究情感机器人,最终有可能人机融合。其媒体实验室与HP公司合作进行情感计算的研究。IBM公司的“蓝眼计划”,可使计算机知道人想干什么,如当人的眼瞄向电视时,它竟知道人想打开电视机,它便发出指令打开电视机。此外该公司还研究了情感鼠标,可根据手部的血压及温度等传感器感知用户的情感。CMU 主要研究可穿戴计算机。日本在对感性信息处理的研究中,有众多研究单位参与,主要集中在研究所和高校。特别值得一提的是,日本欧姆龙公司研制生产的机器玩具曾风行一时,最

人机交互技术及其应用科普_百度文库

人机交互技术及其应用(科普) 信息技术的高速发展对人类生产、生活带来了广泛而深刻的影响。高科技成果为人们带来便捷、快乐的同时,也促进着人机交互技术的发展。作为信息技术的重要内容,人机交互技术比计算机硬件和软件技术的发展要滞后许多,已成为人类运用信息技术深入探索和认识客观世界的瓶颈。因此,人机交互技术已成为21世纪信息领域亟需解决的重大课题和当前信息产业竞争的一个焦点,世界各国都将人机交互技术作为重点研究的一项关键技术,例如,在美国21世纪信息技术计划中,将软件、人机交互、网络、高性能计算列为基础研究内容,美国国防关键技术计划也把人机交互列为软件技术发展的重要内容之一,在我国的“863”、“973”和自然科学基金等项目中,也将人机自然交互理论与方法作为信息技术中需要解决的关键科学问题。 一、人机交互的概念 人机交互(Human-Computer Interaction,HCI)是关于设计、评价和实现供人们使用的交互式计算机系统,且围绕这些方面主要现象进行研究的科学,狭义的讲,人机交互技术主要是研究人与计算机之间的信息交换,它主要包括人到计算机和计算机到人的信息交换两部分。人们可以借助键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等设备,用手、脚、声音、姿势或身体的动作、眼睛甚至脑电波等向计算机传递信息,同时,计算机通过打印机、绘图仪、显示器、头盔式显示器、音箱等输出或显示设备给人提供信息。人机交互与计算机科学、人机工程学、多媒体技术和虚拟现实技术、心理学、认知科学和社会学以及人类学等诸多学科领域有密切的联系,其中,认知心理学与人机工程学是人机交互技术的理论基础,而多媒体技术和虚拟现实技术与人机交互技术相互交叉和渗透。作为是信息技术的一个重要组成部分,人机交互将继续对信息技术的发展产生巨大的影响。 二、人机交互的研究内容 人机交互的研究内容十分广泛,涵盖了建模、设计、评估等理论和方法以及在移动计算、虚拟现实等方面的应用研究与开发,在此列出几个主要的方向:人机交互界面表示模型与设计方法(Model and Methodology) 一个交互界面的好坏,直接影响到软件开发的成败。友好人机交互界面的开发离不开好的交互模型与设计方法。因此,研究人机交互界面的表示模型与设计方法,是人机交互的重要研究内容之一。 可用性分析与评估(Usability and Evaluation) 可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。人机交互系统的可用性分析与评估的研究主要涉及到支持可用性的设计原则和可用性的评估方法等。

人机交互的发展历程及产业链分析

一、人机交互概念 人机交互(Human-ComputerInteraction,HCI)主要是研究用户与系统之间的信息交换,它主要包括用户到系统和系统到用户的信息交换两部分。系统可以是各种各样的机器,也可以是智能电视机、智能手机以及计算机系统和软件。用户可以借助操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等各类穿戴设备,用手势、声音、姿势或身体的动作、眼睛甚至脑电波等向系统传递信息,同时,系统通过各类机器、显示器、音箱等输出或显示设备给人提供信息。 理想状态下,人机交互将不再需要依赖机器语言,在没有键盘、鼠标以及触摸屏等中间设备的情况下,实现随时随地实现人机的自由交流。从而实现人们的物质世界和虚拟网络的最终融合。 从本质上,人机交互技术是一个典型的模式识别问题,智能机器通过多种传感器,获取人的表情、姿态、手势、语音、语调、血压、心率等各种数据,结合当时的环境、语境、情境等上下文信息,识别和理解用户的情感。这包括传感器技术、计算机科学、认知科学、人机工程学、多媒体技术和虚拟现实技术、心理学、哲学以及人类学等诸多学科领域有密切的联系。 二、人机交互产业链 从人机交互过程来讲,可分为四步:通过传感器直接或间接与人接触获得感知信息;通过建立模型对感知信息进行分析与识别;对分析结果进行推理达到感性的理解;将理解结果通过合理的方式表达出来。也就完成了人机交互的全过程。 从功能实现看,人机交互作为一个闭环的模式识别系统,应该包括感知信号的获取、感知信息的分析与识别、感知信息的理解和信息表达等功能四个环节,当感知信息与标准信息存在差异时,将发出指令给予修正或反馈信息给予告警和提示。在这四个方面的环节中,感知信息的识别和感知信息的理解是核心技术的关键所在。 从技术实现过程看,信息获取和信息识别环节属于感知层的范畴,而感知信息的理解和信息表达属于应用层的内容。体感设备实现信息的获取,而嵌入芯片实现体感信号的模式识别,然后通过后台计算机或分布式计算平台建立数学模型、实现强大的运算系统,实现感知信息的理解(理解用户姿态或手势的真实目的),最后转入应用层,调用相关应用程序,满足用户的最终需求。

人机界面设计原则

人机界面设计原则 “以人为本” 1.以用户为中心的基本设计原则 在系统的设计过程中,设计人员要抓住用户的特征,发现用户的需求。在系统整个开发过程中要不断征求用户的意见,向用户咨询。系统的设计决策要结合用户的工作和应用环境,必须理解用户对系统的要求。最好的方法就是让真实的用户参与开发,这样开发人员就能正确地了解用户的需求和目标,系统就会更加成功。 2.顺序原则 即按照处理事件顺序、访问查看顺序(如由整体到单项,由大到小,由上层到下层等)与控制工艺流程等设计监控管理和人机对话主界面及其二级界面。 3.功能原则 即按照对象应用环境及场合具体使用功能要求,各种子系统控制类型、不同管理对象的同一界面并行处理要求和多项对话交互的同时性要求等,设计分功能区分多级菜单、分层提示信息和多项对话栏并举的窗口等的人机交互界面,从而使用户易于分辨和掌握交互界面的使用规律和特点,提高其友好性和易操作性。 4.一致性原则 包括色彩的一致,操作区域一致,文字的一致。即一方面界面颜色、形状、字体与国家、国际或行业通用标准相一致。另一方面界面颜色、形状、字体自成一体,不同设备及其相同设计状态的颜色应保持一致。界面细节美工设计的一致性使运行人员看界面时感到舒适,从而不分散他的注意力。对于新运行人员,或紧急情况下处理问题的运行人员来说,一致性还能减少他们的操作失误。 5.频率原则 即按照管理对象的对话交互频率高低设计人机界面的层次顺序和对话窗口莱单的显示位置等,提高监控和访问对话频率。 6.重要性原则 即按照管理对象在控制系统中的重要性和全局性水平,设计人机界面的主次菜单和对话窗口的位置和突显性,从而有助于管理人员把握好控制系统的主次,实施好控制决策的顺序,实现最优调度和管理。 7.面向对象原则 即按照操作人员的身份特征和工作性质,设计与之相适应和友好的人机界面。根据其工作需要,宜以弹出式窗口显示提示、引导和帮助信息,从而提高用户的交互水平和效率。

基于手势识别的人机交互综述

基于手势识别的人机交互综述 摘要:近年来,得益于虚拟现实、人机界面技术、计算机视觉等领域的发展,基于手势识别的人机交互技术得到大力的推动。本文就基于手势识别的人机交互技术展开综述。首先概括手势交互的涉及领域,回顾其发展史和国内外研究现状。接着阐明它的基本界定和分类,并在此基础上分析其热点关键技术。然后实例讨论了几种类型手势交互的典型应用。最后给出了结论。 关键词:虚拟现实;手势交互;计算机视觉;手势识别;特征跟踪 1.引言 人机交互技术通过输入、输出设备,以有效的方式实现交互主体与交互客体的对话。当前的人机交互技术已经从过去交互主体适应交互客体,发展为交互客体不断地适应交互主体的习惯和以交互主体为中心的新阶段[1,2,3,4]。以用户为中心的,新型、自然的人机交互技术逐渐成为开发者和科研工作者的关注重点。这类交互方式要求输入与输出能够最大限度地符合交互主体的行为习惯,并能够在交互主体的脑中顺利构建交互环路。由于手势具有极强的信息表述功能,加之人手操作行为本身就是人与世界相互作用的主要方式,因此,基于手识别的人机交互技术相关研究有着重要的理论价值和应用价值。基于手势识别的人机交互技术涉及计算机科学、认知心理学、行为学等诸多方面的知识。本文不能面面俱到,仅就手势交互的基本问题:手势语义的分类,以及当前发展概况、研究热点技术和典型系统应用等相关问题进行综述。 2.研究现状 目前,基于视觉的手势交互已被广泛的研究,由于手势本身的多义性及时空差异性,加之手形变的高维度及视觉问题本身的不适定性,基于视觉的手势识别一直是一项极富挑战性的究课题[5]。需要解决的核心问题是对手形的识别,对手势的跟踪等。传统的方法主要分为两大类:(1)基于模型(model-base)的方法;(2)基于表征(appearance-based)的方法[6]。这些方法及其衍生算法极大程度地依赖于计算机科学中虚拟现实、机器视觉、模式识别、人机交互等多个领域的交流与合作。相关的国际会议:CHI、ICCV、CVPR、ICAT、IEEE VR 为研究者提供了一个能充分交流的空间,并吸引了越来越多的研究人员共同参与合作。此外,学科之间的交流也吸引了心理学研究人员的共同参与。他们以从用户为中心出发,为基于手势交互研究和开发提出了宝贵意见[7]。纵观手势交互的发展历程,其研究重点也从早期简单的系统框架、低层特征提取[8]、手形模板匹配[8]等问题转变到关节式物体跟踪[9,10, 11]、跟踪性能评价[12]、操作型手势解析[14]等问题上。我国在基于手势识别的人机交互领域的研究近年来得到了长足的发展。研究机构集中在国内的研究所和高校的科研单位。目前国内手势交互的研究成果主要有:中国科学院软件研究所[15]的研究中,对二阶自回归过程动力学模型(Auto-Regressive Process, ARP)进行训练和学习,进而建立基于ARP 的预测模型,实现了人手运动的鲁棒性跟踪,在出现跟踪丢失的情况下在后续序列中可以自动恢复正确跟踪。中国科学院自动化研究所模式识别实验室提出一种基于区域的多连接体(手指)的三维运动跟踪算法[13],用多约束融合的方法以及手指的运动特性,建立多刚体的三维运动描述,通过三类基本约束条件,把跟踪问题归结为一个约束误差优化问题。清华大学的崔锦实博士,提出一种基于回归-优化方法的关节式物体的姿态估计方法[16]。该方法把回归分析与全局优化搜索相结合,保证了估计的精度和连续性;针对现有滤波器在高维非线性多峰

人机交互技术的发展与现状

人机交互技术的发展与现状 一.什么是人机交互技术? 二.人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、 输出设备,以有效的方式实现人与计算机对话的技术。人机交互技术包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题及提示请示等。人机交互技术是计算机用户界面设计中的重要内容之一。它与认知学、人机工程学、心理学等学科领域有密切的联系。也指通过电极将神经信号与电子信号互相联系,达到人脑与电脑互相沟通的技术,可以预见,电脑甚至可以在未来成为一种媒介,达到人脑与人脑意识之间的交流,即心灵感应。二. 人机交互技术的发展人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。 1959年美国学者B.Shackel从人在操纵计算机时如何才能减轻疲劳出发,提出了被认为是人机界面的第一篇文献的关于计算机控制台设计的人机工程学的论文。1960年,Liklider JCK首次提出人机紧密共栖(Human-Computer Close Symbiosis)的概念,被视为人机界面学的启蒙观点。1969年在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业杂志国际人机研究(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。在1970年成立了两个HCI研究中心:一个是英国的Loughbocough大学的HUSAT研究中心,另一个是美国Xerox公司的Palo Alto研究中心。 1970年到1973年出版了四本与计算机相关的人机工程学专着,为人机交互界面的发展指明了方向。 20世纪80年代初期,学术界相继出版了六本专着,对最新的人机交互研究成果进行了总结。人机交互学科逐渐形成了自己的理论体系和实践范畴的架构。理论体系方面,从人机工程学独立出来,更加强调认知心理学以及行为学和社会学的某些人文科学的理论指导;实践范畴方面,从人机界面(人机接口)拓延开来,强调计算机对于人的反馈交互作用。人机界面一词被人机交互所取代。HCI中的I,也由Interface(界面/接口)变成了Interaction(交互)。人机

人机交互风格及其发展趋势 (UI设计发展趋势)

人机交互风格及其发展趋势 (UI设计发展趋势) 摘要人机交互的风格经历了命令界面、图形界面、多媒体界面等主要发展阶段,目前正向虚拟现实技术和多通道用户界面的方向发展。本文简要回顾人机交互技术的历史,并进而探讨什么是理想、自然的人机交互模式。 关键词人机交互交互风格多通道用户界面虚拟现实 Abstract The style of human computer interaction has gone through several stages includingcommand user interface, graphical user interface, direct manipulation user interface,multimedia user interface, and is rogressing toward multimodal user interface and virtualreality. This paper reviews the history of human computer interaction and discuss what isthe ideal and natural human computer interaction mode. Key Words Human computer interaction Interaction style Multimodal user interface Virtualreality 引言 人们对人机系统关系的认识问题,伴随着人机关系基本观点的变化由来已久。在计算机出现的不足半个世纪的时间里,人机交互技术经历了巨大的变化。以下从几个不同的角度来观察和总结人机交互技术发生的变化及发展趋势: (1)就用户界面的具体形式而言,过去经历了批处理、联机终端(命令接口)、(文本)菜单等多通道——多媒体用户界面和虚拟现实系统。 (2)就用户界面中信息载体类型而言,经历了以文本为主的字符用户界面(CUI)、以二维图形为主的图形用户界面(GUI)和多媒体用户界面,计算机与用户之间的通信带宽不断提高。 (3)就计算机输出信息的形式而言,经历了以符号为主的字符命令语言、以视觉感知为主的图形用户界面、兼顾听觉感知的多媒体用户界面和综合运用多种感观(包括触觉等)的虚拟现实系统。在符号阶段,用户面对的只有单一文本符号,虽然离不开视觉的参与,但视觉信息是非本质的,本质的东西只有符号和概念。在视觉阶段,借助计算机图形学技术使人机交互能够大量利用颜色、形状等视觉信息,发挥人的形象感知和形象思维的潜能,提高了信息传递的效率。早期的计算机系统只有单调的峰鸣声,虽然多媒体技术将声频形式和视频形式同时带入人机交互,但仍缺少听觉交互手段,即人处于被动收听状态,声音缺少位置和方向的变化,交互输入方面仍沿用图形用户界面所采用的键盘和鼠标器等交互设备。当前,在人机交互中结合进视觉的、听觉的以及更多的通道是必然趋势,特别是将听觉通道作为补充的或替换的信息通道已显示出重要性和优越性〔1〕。 (4)就人机界面中的信息维度而言,经历了一维信息(主要指文本流,如早期电传式终端)、二维信息(主要是二维图形技术,利用了色彩、形状、纹理等维度信息)、三维信息(主要是三维图形技术,但显示技术仍利用二维平面为主)和多维信息(多通道的多维信息)空间。 不论从何种角度看,人机交互发展的趋势体现了对人的因素的不断重视,使人机交互更接近于自然的形式,使用户能利用日常的自然技能,不须经过特别的努力和学习,认知负荷降低,工作效率提高。这种“以人为中心”的思想特别是自80年代以来,在人机交互技术的研究中得到明显的体现。本文通过简要回顾和

(完整版)人机交互课后习题答案

习题1 1.什么是人机交互? 人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。 它包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题等。人机交互技术是计算机用户界面设计中的重要内容之一。它与认知学、人机工程学、心理学等学科领域有密切的联系。 1.简单介绍人机交互技术的研究内容。 1.人机交互界面表示模型与设计方法 2.可用性分析与评估 3.多通道交互技术 4.认知与智能用户界面 5.群件 6.Web设计 7.移动界面设计。 2.简单介绍人机交互技术的发展历史。 人机交互的发展过程,也是人适应计算机到计算机不断地适应人的发展过程。它经历了几个阶段: 命令行图形用户界面自然和谐的交互

1.命令行界面交互阶段 计算机语言经历了由最初的机器语言,而后是汇编语言,直至高级语言的发展过程。这个过程也可以看作早期的人机交互的一个发展过程 2.图形用户界面(GUI)交互阶段 1)图形用户界面(Graphical User Interface,GUI)的出 现,使人机交互方式发生了巨大变化。GUI 的主要特点是桌 面隐喻、WIMP技术、直接操纵和“所见即所得”。 2)与命令行界面相比,图形用户界面的人机交互自然性和效 率都有较大的提高。图形用户界面很大程度上依赖于菜单选 择和交互小组件(Widget)。 3)图形用户界面给有经验的用户造成不方便,他们有时倾向 使用命令键而不是选择菜单,且在输入信息时用户只能使用 手这一种输入通道。 4)图形用户界面需要占用较多的屏幕空间,并且难以表达和 支持非空间性的抽象信息的交互。 3.自然和谐的人机交互阶段 随着虚拟现实、移动计算、无处不在计算等技术的飞速发展,自然和谐的人机交互方式得到了一定的发展。基于语音、手写体、姿势、视线跟踪、表情等输入手段的多通道交互是其主要特点,其目的是使人能以声音、动作、表情等自然方式进行交互操作。习题2

人机交互技术的发展与现状定稿版

人机交互技术的发展与 现状精编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

人机交互技术的发展与现状 一. 什么是人机交互技术 二. 人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输 入、输出设备,以有效的方式实现人与计算机对话的技术。人机交互技术包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题及提示请示等。人机交互技术是计算机用户界面设计中的重要内容之一。它与认知学、人机工程学、心理学等学科领域有密切的联系。 也指通过电极将神经信号与电子信号互相联系,达到人脑与电脑互相沟通的技术,可以预见,电脑甚至可以在未来成为一种媒介,达到人脑与人脑意识之间的交流,即心灵感应。二.人机交互技术的发展人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。 1959年美国学者B.Shackel从人在操纵计算机时如何才能减轻疲劳出发,提出了被认为是人机界面的第一篇文献的关于计算机控制台设计的人机工程学的论文。1960年,Liklider JCK首次提出人机紧密共栖(Human-Computer Close Symbiosis)的概念,被视为人机界面学的启蒙观点。 1969年在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业杂志国际人机研究(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。在1970年成立了两个HCI研究中心:一个是英国的Loughbocough大学的HUSAT研究中心,另一个是美国Xerox公司的Palo Alto研究中心。 1970年到1973年出版了四本与计算机相关的人机工程学专着,为人机交互界面的发展指明了方向。 20世纪80年代初期,学术界相继出版了六本专着,对最新的人机交互研究成果进行了总结。人机交互学科逐渐形成了自己的理论体系和实践范畴的架构。理论体系方面,从人机工程学独立出来,更加强调认知心理学以及行为学和社会学的某些人文科学的理论指导;实践范畴方面,从人机界面(人机接口)拓延开来,强调计算机对于人的反馈交互作用。人机界面一词被人机交互所取代。HCI中的I,也由

人机交互发展状况深度分析及前景预测分析汇总

人机交互发展状况深度分析及前景预测分析 一、人机交互概念 人机交互(Human-ComputerInteraction,HCI)主要是研究用户与系统之间的信息交换,它主要包括用户到系统和系统到用户的信息交换两部分。系统可以是各种各样的机器,也可以是智能电视机、智能手机以及计算机系统和软件。用户可以借助操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等各类穿戴设备,用手势、声音、姿势或身体的动作、眼睛甚至脑电波等向系统传递信息,同时,系统通过各类机器、显示器、音箱等输出或显示设备给人提供信息。 理想状态下,人机交互将不再需要依赖机器语言,在没有键盘、鼠标以及触摸屏等中间设备的情况下,实现随时随地实现人机的自由交流。从而实现人们的物质世界和虚拟网络的最终融合。 从本质上,人机交互技术是一个典型的模式识别问题,智能机器通过多种传感器,获取人的表情、姿态、手势、语音、语调、血压、心率等各种数据,结合当时的环境、语境、情境等上下文信息,识别和理解用户的情感。这包括传感器技术、计算机科学、认知科学、人机工程学、多媒体技术和虚拟现实技术、心理学、哲学以及人类学等诸多学科领域有密切的联系。 二、人机交互发展阶段 从以设备为主到忽略设备存在,是人机交互的基本发展思路。交互建立初始,从按键到触控屏的转变是关键,重点是提高触控性能和扩大触控范围;同时显示质量从VGA至UHD (4K);工业设计方面则是更纤薄的曲面显示。之后,专注于用户的个性化交互还是被广泛应用,变革的标志是密码的使用正在减少,取而代之的是生物识别(用户独有的特征)。这将推动移动支付的普及,但仍需要协调银行,支付机构,商家,技术提供商等各个环节,因此需要FIDO(线上快速身份验证)联盟来制定标准。接下来,专注于环境的情景识别交互是必然趋势,这个阶段的目标是让设备能够了解环境情况,能够预知用户的潜在需求。这需要不同类型的传感器一起工作,增强现实感。最终,个人设备将退居幕后,甚至消失在信息基础设施中,取而代之的是纤巧尺寸的传感器将无处不在。这是通过全方位感知来获得终极用户体验的阶段。 三、人机交互产业链

人机交互设计

人机交互、人机互动(英文:Human–Computer Interaction 或Human–Machine Interaction,简称HCI或HMI),是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板,或发电厂的控制室。人机交互界面的设计要包含用户对系统的理解(即心智模型),那是为了系统的可用性或者用户友好性。 相关知识点 1、什么是人机交互 所谓的人机交互是指关于如何设计、评价和实现供人们使用的交互式计算机系统,并围绕相关现象进行研究的一门学科。人机交互是一门综合性的学科,他与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关,其中,认知心理学和人机工程学是人机交互的理论基础,多媒体技术和虚拟现实技术与人机交互相互交叉、相互渗透。 2、人机交互的研究内容 人机交互界面的表示模型与方法 可用性分析与评价 多通道交互技术 认知与智能用户界面

群件 web设计 移动界面设计 3、人机交互的发展历史 命令行界面交互阶段、图形用户界面交互阶段、自然和谐的人机交互阶段(情感计算、多通道交互、虚拟现实、只能用户界面) 4、人机交互的发展趋势 智能化、集成化、网络化、标准化 1、人的感知 视觉、触觉、听觉,其中人类从周围世界获取的信息80%都来源于视觉。 2、颜色通常用三种属性表示:强度、饱和度、色度 颜色模型就是某个空间中的一个可见光子集,主要有RGB,CMYK,HSV,CIE四种颜色模型 3、认知过程与交互设计原则 (1)认知分为经验认知和思维认知,经验认知是指有效、轻松的观察、操作和响应周围的事件,他要求具备某些专业的知识并达到一定的熟练程度。思维认知是它涉及思考、比较和决策,是发明创造

人机交互设计

人机交互(Human-Computer Interaction,简写HCI):是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。有很多著名公司和学术机构正在研究人机交互。在计算机发展历史上,人们很少注意计算机的易用性。现在,很多计算机用户抱怨计算机制造商在如何使其产品“用户友好”这方面没有投入足够的精力。而反过来,这些计算机系统开发商也在抱怨,他们的理由是:设计和制造计算机是一个很复杂的工作,光是研究如何在新领域能够应用计算机的问题就已经占用了他们的大部分精力,实在是没有多余的精力来研究如何提高计算机的易用性了。 人机交互(HCI)的一个重要问题是:不同的计算机用户具有不同的使用风格——他们的教育背景不同、理解方式不同、学习方法以及具备技能都不相同,比如,一个左撇子和普通人的使用习惯就完全不同。另外,还要考虑文化和民族的因素。其次,研究和设计人机交互需要考虑的是用户界面技术变化迅速,提供的新的交互技术可能不适用于以前的研究。还有,当用户逐渐掌握了新的接口时,他们可能提出新的要求。 [1] 详细释义 操作系统的人机交互功能是决定计算机系统“友

善性”的一个重要因素。人机交互功能主要靠可输入输出的外部设备和相应的软件来完成。可供人机交互使用的设备主要有键盘显示、鼠标、各种模式识别设备等。与这些设备相应的软件就是操作系统提供人机交互功能的部分。人机交互部分的主要作用是控制有关设备的运行和理解并执行通过人机交互设备传来的有关的各种命令和要求。早期的人机交互设施是键盘显示器。操作员通过键盘打入命令,操作系统接到命令后立即执行并将结果通过显示器显示。打入的命令可以有不同方式,但每一条命令的解释是清楚的,唯一的。 随着计算机技术的发展,操作命令也越来越多,功能也越来越强。随着模式识别,如语音识别、汉字识别等输入设备的发展,操作员和计算机在类似于自然语言或受限制的自然语言这一级上进行交互成为可能。此外,通过图形进行人机交互也吸引着人们去进行研究。这些人机交互可称为智能化的人机交互。这方面的研究工作正在积极开展。

人机交互设计

人机交互设计是单美贤于2016年9月由电子工业出版社出版的一本书。 计算机现代技术的飞速发展为用户提供了丰富多样的经验,人机交互设计的研究受到了广泛的关注。本书从人机交互的基本概念入手,在交互设计过程的基础上,详细介绍了需求分析,体系结构设计,开发支持和测试优化过程的知识。本书着眼于以人为本的用户需求,分析了可用性和用户体验,并指导读者注意交互设计原则并树立以用户为中心的设计理念。 人机交互,人机交互(HCI或HMI)是对系统与用户之间交互的研究。系统可以是各种机器或计算机化的系统和软件。人机界面通常是指用户可见的部分。用户通过人机界面与系统通信并进行操作。它的大小与收音机的播放按钮一样小,与飞机的仪表板或发电厂的控制室一样大。人机交互界面的设计应包括用户对系统的理解(即心理模型),以了解系统的可用性或用户友好性。 基本信息 人机交互(HCI)是指人与计算机之间以某种方式进行信息交换以通过使用人与计算机之间的某种对话语言来完成某些任务的过程。有许多研究人机交互的著名公司和学术机构。

在计算机发展的历史中,人们很少关注计算机的易用性。如今,许多计算机用户抱怨计算机制造商没有为使产品“用户友好”而付出了足够的努力。相反,这些计算机系统开发人员也抱怨,他们的原因是:计算机的设计和制造是一项非常复杂的工作,只是研究如何将计算机应用于新领域已占据了他们的大部分精力,没有多余的精力研究如何提高计算机的易用性。 人机交互(HCI)的一个重要问题是不同的计算机用户具有不同的使用方式-他们具有不同的教育背景,不同的理解方式,不同的学习方法和不同的技能。例如,惯用左手的人和普通人的使用习惯完全不同。此外,应考虑文化和种族因素。其次,人机交互的研究和设计需要考虑用户界面技术的快速变化,而提供的新的交互技术可能不适合以前的研究。另外,随着用户了解新界面,他们可能会要求新的要求。[1] 详细说明 操作系统的人机交互功能是确定计算机系统的“朋友” “善良”是一个重要因素。人机交互的功能主要取决于外部设备和相应软件的输入和输出。可用于人机交互的设备主要包括键盘显示器,鼠标,各种模式识别设备等。与这些设备

进行人机界面设计的研究

进行人机界面设计的研究 1.界面风格的设计控制台人机界面选用非标准Windows风格,以实现用户个性化的要求。但考虑到大多数用户对于标准Windows系统较熟悉,在界面设计中尽量兼容标准Windows界面的特征。界面使用的功能按钮选用MFC类库提供的CBmpButton类动态创建自定义位图图标的按钮。因为位图按钮可在操作中实现高亮度、突起、凹陷等效果,使界面表现形式更灵活,同时可以方便用户对控件的识别。但是,界面里使用的对话框、编辑框、组合框等都选用Windows标准控件,对话框中的按钮也使用标准按钮。控件的大小和间距尽量符合Windows界面推荐值的要求。 界面默认窗体的颜色是亮灰色。因为灰色调在不同的光照条件下容易被识别,且避免了色盲用户在使用窗体时带来的不便。为了区分输入和输出,供用户输入的区域使用白色作为底色,能使用户容易看到这是窗体的活动区域;显示区域设为灰色(或窗体颜色),目的是告诉用户那是不可编辑区域。窗体中所有的控件依据Windows界面设计标准采用左对齐的排列方式。对于不同位置上多组控件,各组也是左对齐排列的。 人机界面的布局设计根据人体工程学的要求应该实现简洁、平衡和风格一致。典型的工控界面分为3部分:标题菜单部分、图形显示区以及按钮部分,如图1所示。该界面界面美观,在屏幕上的对象左右达到平衡、不堆挤在某一处,无杂乱无章的感觉。数据的过分拥挤会产生视觉疲劳和接收错误。界面的平衡原则推荐显示屏幕总体性覆盖度不超过40%,而分组中屏幕覆盖度不超过20%。控制台人机界面中包含着大量的图形显示信息,因此将图形显示区布置在屏幕长宽各占屏幕70%左右的范围内,以保证显示信息的清晰和全面。控制按钮组布置在显示区的右侧,一方面是考虑到绝大多数操作者是右手操作用户,按钮区布置在最右侧更加方便;另一方面是根据界面布局的主次原则,把用户注意力最集中的左上区域留给图形显示区。 根据一致性原则,保证屏幕上所有对象,如窗口、按钮、莱单等风格的一致。各级按钮的大小、凹凸效果和标注字体、字号都保持一致,按钮的颜色和界面底色保持一致。 选择界面的概念取决于多个界面。可将界面设计为循环或FIFO缓冲器。

人机交互30年

人机交互30年 自1982年ACM成立人机交互专门兴趣小组SIGCHI(Special Interest Group on Comput er-Human Interaction)以来,人机交互(Computer-Human Interaction,CHI)已走过了近30年历程。键盘的出现,将计算机带入了字符用户界面时代。1964年,美国人道格·恩格尔巴特(Do ug Engelbart)发明了鼠标(图1),图形用户界面(Graphical User Interface,GUI)随之出现,才有了计算机的主机时代和个人计算机时代,为此,恩格尔巴特也获得了1997年的图灵奖。自图形用户界面出现至今的几十年中,人机交互技术经历了几代人的努力,成就了PC时代的辉煌。 图1 Doug Engelbart和他发明的鼠标 70年代Xerox研究中心的Alan Kay提出了Smalltalk面向对象程序设计等思想,并发明了重叠式多窗口系统。 1989年Tim Berners-Lee在日内瓦的CERN用HTML及HTTP开发了WWW网,随后出现了各种浏览器(网络用户界面),使互联网飞速发展起来。 图2 Alan Kay和Tim Berners-Lee 由于笔式交互、触摸、语音、以及基于视频等自然交互设备的出现,新的计算模式被提出,人机交互进入了普适计算(Pervasive Computing)时代。

90年代美国麻省理工学院N.Negroponte领导的媒体实验室在新一代多通道用户界面方面(包括语音、手势、智能体等),做了大量开创性的工作。 90年代美国Xerox公司PARC的首席科学家Mark Weiser首先提出“无所不在计算(Ubiq uitous Computing)”思想。 人机交互是研究人类所使用的交互式计算系统的设计、实施、评估以及相关主要现象的学科,用户界面(User Interface,UI)是人与计算机之间传递、交换信息的媒介和对话接口,是计算机系统的重要组成部分,用户界面是人机交互技术的物质表现形式。所以在普适计算时代自然交互是其研究的重要主题,人机交互的历史也是从人适应计算机到计算机不断地适应人的发展史。回顾人机交互的发展史,主要经历了以下几个阶段(图3): 1、早期的手工作业阶段; 2、作业控制语言及交互命令语言阶段; 3、图形用户界面(GUI)阶段; 4、网络用户界面的出现; 多通道、多媒体的智能人机交互阶段。 图3 界面范式的发展过程 在早期的命令语言用户界面时代,人和计算机的交互主要是通过键盘来完成的。而此时的计算机主要是大型机,用来进行科学计算,接受文本命令;随着图形界面和鼠标的出现,计算机进入了个人PC时代,接受GUI命令,并帮助我们我们实现了办公自动化。WIMP界面范式是图形界面电脑所采用的界面典范。在人机互动领域之中是最普遍的电脑互动界面,WIMP堪称无人能出其右,举凡微软的Windows、苹果电脑的MacOS,甚至其它以X-Window为基础的操作系统,均采用WIMP此一界面典范。WIMP是由“视窗”(Window)、“图标”(Icon)、“选单”(Menu)以及“指标”(Po inter)所组成的缩写,其命名方式也指明了它所倚赖的四大互动元件。曾经有人这样评价图形用户界面:“PC plus GUI made the history”。但随着计算机硬件设备的进步和软件技术的发展,WI MP界面的缺点逐渐地体现出来。目前研究者们将研究的焦点聚集到下一代的用户界面的研究上,提出了Post-WIMP(或Non-WIMP)的界面形式。 用户界面技术的每一次飞跃都需要认知心理学成果的支撑,在人机交互的心理学研究当中,自然、智能用户界面目标是:帮助计算机了解用户,帮助用户更好地使用计算机。WIMP界面概念模型中,认知主体和计算机的交互过程如图5所示,认知主体通过击键或指点向应用程序输入指令,应用程序通过窗口、图标、菜单以及文本向认知主体反馈信息。这种界面模型将认知主体的注意力集中在如何使用计算机上而不是任务的本身。

相关文档
最新文档