人机交互30年
- 格式:docx
- 大小:3.64 MB
- 文档页数:10
近30年我国化学教学艺术研究的反思与展望摘要近30年,我国化学教学艺术研究主要围绕教学技能的娴熟化和艺术技巧2个层面展开,取得了重大的发展。
化学教学艺术研究存在的主要问题是:教学艺术形成机制的研究缺失;理论基础较为薄弱;缺乏学科特征性;教与学的关系失衡;研究方法单一。
要走出化学教学艺术研究的困境,应该拓展研究疆域和拓宽研究方法。
关键词化学教学艺术教学技能提问艺术板书艺术布白艺术1近30年我国化学教学艺术研究概况20世纪80年代,我国拉开了教学艺术研究的序幕,90年代掀起了教学艺术研究的热潮,到21世纪初教学艺术理论已经比较丰富。
教学艺术发生于学科教学艺术。
学科教学艺术的研究有助于丰富和发展教学艺术论的研究成果。
我国化学教学艺术研究的专著主要有:中学化学特级教师撰写的《中学化学教学艺术》(廖可珍,1989),《陆禾化学教学艺术与研究》(陆禾,1997),《曹洪昌化学教学艺术与研究》(曹洪昌,2000)。
这些著作凝聚了特级化学教师教学艺术的感悟和实践经验。
西南师范大学李远蓉的《化学教学艺术论》(1996),北京教育学院朱嘉泰、李俊的《化学教学艺术论》(2002),2部化学教学艺术论专著的出版,标志着化学教学艺术论作为一门独立学科的初步确立。
笔者检索中国学术期刊全文数据库(1979—2008)的全部论文,收集到有关化学教学艺术的论文共171篇,检索中国优秀硕士学位论文全文数据库(1999—2008),发现化学教学艺术研究的硕士论文4篇。
近30年化学教学艺术研究的成果,较多的体现在教学技能的艺术层面,研究方法主要是经验总结法。
厘清化学教学艺术研究的现状,探寻化学教学艺术发展中存在的问题,拓展其发展的路径和疆域,无疑具有重要意义。
1.1教学技能层面的艺术化学教学语言艺术。
廖可珍(1988)提出化学教学语言艺术的特点为:“科学性;通俗性;趣味性;节奏性;直观性;时空性;启发性;含蓄性。
”刘一兵(2004)将化学教学语言艺术的特征分为2个层次:一是化学教学语言艺术的内部特征,即语义,语言的含义;二是化学教学语言艺术的外部特征,即使人听之有声、感之有气的发声,是语义的物质外壳。
Report:全球30家人形机器人公司:产品和进度梳理人形机器人行业洞察研究(BTIResearch)2024年3月全球主要人形机器人公司产品进度总览区域企业产品名称产品进展视频发布发布会公开场合行走公开展示灵巧手工作演示语音整合自主工作试点应用部署国内优必选Walker X ⦿⦿⦿⦿达闼机器人XR-4⦿⦿傅利叶智能Fourier GR1⦿⦿⦿智元机器人RAISE-A1⦿⦿⦿⦿宇树科技Unitree H1⦿⦿⦿无灵巧手小米Cyberone ⦿研发⦿无灵巧手科大讯飞⦿小鹏汽车PX5⦿⦿⦿无灵巧手逐际动力CL-1⦿⦿⦿无灵巧手MagicLab MagicBot ⦿开普勒Forerunner ⦿⦿⦿均胜集团JARVIS ⦿⦿⦿⦿追觅科技Eame One ⦿国外TeslaOptimus ⦿⦿⦿⦿⦿⦿Boston Dynamics Atlas⦿研发⦿无灵巧手1X Technologies EVE/NEO ⦿⦿无腿(EVE)无灵巧手(EVE )⦿⦿Agility Robotics Digit ⦿⦿⦿无灵巧手⦿⦿⦿⦿Figure.ai 01⦿⦿⦿⦿⦿⦿⦿⦿Sanctuary AI Phoenix ⦿⦿⦿⦿⦿ApptronikApollo ⦿⦿⦿⦿Engineered ArtsAmeca ⦿⦿OSAKA UNIVERSITY & MIXIALTER 3⦿无腿⦿KARLSRUHE INSTITUTE OF TECHNOLOGY ARMAR-6⦿无腿⦿Beyond Imagination Beomni ⦿无腿⦿Macco Robotics KIME ⦿无腿无灵巧手⦿⦿⦿SoftBank RoboticsNAO ⦿⦿⦿⦿⦿⦿⦿⦿PEPPER⦿⦿无腿⦿⦿⦿⦿⦿PROMOBOTPROMOBOT ⦿无腿⦿⦿⦿⦿⦿UNIVERSITY OF TEHRAN SURENA IV ⦿⦿⦿⦿TOYOTA T-HR 3⦿⦿⦿IHMCNadia⦿研发⦿无灵巧手主要发展历程◆21 年8 月,马斯克于首届AI DAY展示人形机器人概念机Tesla Bot◆22 年2 月,特斯拉成功推出人形机器人原型机,并作为开发平台进行深度研发◆22 年9 月,特斯拉发布新版本Optimus 人形机器人,可以实现直立行走、搬运、洒水等复杂动作◆23 年5 月,特斯拉在年度股东大会上展示了Optimus 最新样机Gen 1◆23 年12 月,特斯拉发布Optimus Gen 2◆24年2月发布最新Optimus Gen 2最新行走视频最新迭代产品:Optimus Gen 2◆Optimus Gen 比上一代轻了10 公斤,在各方面都有所改进,行走速度快了30%,移动方式也更加自然、平衡和精确。
人机交互技术智慧树知到课后章节答案2023年下黑龙江科技大学黑龙江科技大学第一章测试1.人机交互可划分()三个要素。
A:计算机B:地理位置C:交互D:人答案:计算机;交互;人2.人机交互只研究计算机等机械装置,不研究人的因素。
()A:错 B:对答案:错3.微软的DOS系统主要是基于键盘的命令行的交互方式。
()A:对 B:错答案:对4.上世纪60年代中期,基于()成为大多数计算机的主要交互方式。
A:图形用户界面B:键盘的命令行接口C:触摸屏输入接口D:语言交互接口答案:键盘的命令行接口5.命令行界面,操作员主要通过操作键盘输入数据和命令信息,界面输出以()为主。
A:字符B:影像C:声音D:图像答案:字符6.图形用户界面的主要特点是()。
A:WIMP技术B:直接操纵C:桌面隐喻D:所见即所得答案:WIMP技术;直接操纵;桌面隐喻;所见即所得7.自然人机交互阶段目的是使人能以声音、动作、表情等自然方式进行智能交互操作。
()A:错 B:对答案:对8.人机交互方式多种多样,比如()等,都是未来智能交互技术发展的方向。
A:手势识别B:体感识别C:图像识别D:答案选项均不正确答案:手势识别;体感识别;图像识别9.完整的人体动作分析过程主要包括()部分。
A:动作分类识别B:答案选项均正确C:动作特征描述D:动作捕捉答案:答案选项均正确10.虚拟现实交互技术在医疗领域的应用,包括以下几个方面()。
A:远程协作手术B:远程会诊C:虚拟手术训练D:手术规划及导航答案:远程协作手术;远程会诊;虚拟手术训练;手术规划及导航第二章测试1.认知过程即是认识客观事物的过程,即对信息进行加工处理的过程,反映客观事物特征与内在联系的心理活动。
()A:错 B:对答案:对2.格式塔心理学认为这个图形属于()。
A:对称性法B:接近法则C:闭合法则D:相似法则答案:接近法则3.人与计算机的交互中,用户接受计算机输出的信息,向计算机输入信息,这个过程主要通过()感知完成的。
2018年辽宁省继续教育供需科目“互联网+”试题和答案(90分)一、单项选择题在下列各题的四个选项中,只有一个答案是符合题目要求的。
【单选题】第(1)题下列()有利于丰富互联网产业发展模式。
【2分】A. 云计算B. 大数据C. 共享经济D. 物联网ABCD【单选题】第(2)题()是把互联网的创新成果与经济社会各个领域深度融合,推进技术进步、效率提升和组织变革,提升实体经济创新力和生产力,形成更广泛的、以互联网为基础设施和创新要素的经济社会发展形态。
【2分】A. 云计算B. 大数据C. “互联网+”D. 物联网ABCD【单选题】第(3)题 1997年至()年是纯互联网时代。
【2分】A. 2000B. 2006C. 2010D. 2015ABCD【单选题】第(4)题计算机发展至今,每隔()年会出现一次人机交互界面的重大变革。
【2分】A. 20B. 25C. 30D. 35BCD【单选题】第(5)题()年3月,Uber在杭州推出“一键叫船”服务。
【2分】A. 2012B. 2013C. 2014D. 2015ABCD【单选题】第(6)题射频识别系统(RFID)阅读器(Reader)的主要任务是()。
【2分】A. 控制射频模块向标签发射读取信号,并接收标签的应答,对其数据进行处理B. 存储信息C. 对数据进行运算D. 识别相应的信号BCD【单选题】第(7)题互联网模式下的平台创新从()网站开始,让买卖双方直接在网上进行交易,连接了以往缺乏完善渠道的两个用户群体。
【2分】A. YahooB. SohuC. 当当D. EBayABCD【单选题】第(8)题在我国,()年谢平在其研究报告中首次明确提出“互联网金融”的概念。
【2分】A. 2012B. 2014C. 2015D. 2016BCD【单选题】第(9)题党中央、国务院一直高度重视信息化工作,党的十五届()中全会把信息化提到了国家战略的高度。
【2分】A. 二B. 三C. 四D. 五ABCD【单选题】第(10)题 .所有的用户都是通过中央服务器来发生信息的一个交互,这是第()代互联网技术的特征【2分】A. 一B. 二C. 三D. 四ABCD【单选题】第(11)题()年1月7日,恒大地产通过“秒赚平台”投放了一波“跨年抢房”红包广告,一时间全民风靡。
伦敦大学学院人机交互专业伦敦大学学院,简称UCL,建校于1826年,位于英国伦敦,是一所世界顶尖公立综合研究型大学,排名稳居世界前十,为享有顶级声誉的英国老牌名校。
下面是美行思远小编为大家带来的关于伦敦大学学院人机交互专业的介绍,一起来看看吧!伦敦大学学院人机交互专业人机交互(MSc)Human-computer Interaction学制:1年学费(18/19):25,880英镑/年专业特点:UCL的人机交互专业,主要研究人体机能、意识、社会因素、情感因素对于交互设计体系的影响。
学会分析、测试用户行为、喜好、体验等等以人为中心的交互体系所涉及的因素。
最终能够应对各种用户为中心的设计风格。
专业教学:该专业要求学生修满180学分。
课程包括2门必修课,每门课学分为30分;4门选修课,每科15学分;以及60学分的研究项目。
UCL人机交互专业授课,采用讲座与实践活动相结合的方式。
其中实践活动则通过个人或小组项目的形式展开,项目内容包括对系统进行评估,或者进行原型制作。
最终成绩评估,采用课后作业与考试相结合的方式。
课后作业形式多样,包括作品集、课堂展示、视频、报告、线上学习任务、学术论文等。
该项目的授课过程由UCL的交互中心负责。
UCL的交互中心是世界顶级的人机交互中心,与校外企业以及研究社群有着良好的合作关系。
因与校外行业的良好合作关系,来UCL学习人机交互专业的同学,每周都有机会聆听业内人士演讲,还能参加实地考察。
另外,选择UCL人机交互专业的学生,能接触同领域内最顶级的研究项目。
之所以这样说,是因为UCL在这方面有众多先例可循,曾有很多UCL的研究项目在顶级国际会议上被发表和展示。
未来就业:人机交互专业除了重视培养学生的调研技巧,还从雇主对人才的需求出发,培养学生在作品展示、写作、协调合作方面的能力。
另外,UCL非常善于利用自己在伦敦与世界各地的校友资源,许多校友回到学校为学生演讲,为近期毕业生提供工作机会。
移动机器人的发展史1920年捷克斯洛伐克作家卡雷尔·恰佩克在他的科幻小说《罗萨姆的机器人万能公司》中,根据Robota(捷克文,原意为“劳役、苦工”)和Robotnik(波兰文,原意为“工人”),创造出“机器人”这个词。
1939年美国纽约世博会上展出了西屋电气公司制造的家用机器人Elektro。
它由电缆控制,可以行走,会说77个字,甚至可以抽烟,不过离真正干家务活还差得远。
但它让人们对家用机器人的憧憬变得更加具体。
1942年美国科幻巨匠阿西莫夫提出“机器人三定律”。
虽然这只是科幻小说里的创造,但后来成为学术界默认的研发原则。
1948年诺伯特·维纳出版《控制论》,阐述了机器中的通信和控制机能与人的神经、感觉机能的共同规律,率先提出以计算机为核心的自动化工厂。
1954年美国人乔治·德沃尔制造出世界上第一台可编程的机器人,并注册了专利。
这种机械手能按照不同的程序从事不同的工作,因此具有通用性和灵活性。
1956年在达特茅斯会议上,马文·明斯基提出了他对智能机器的看法:智能机器“能够创建周围环境的抽象模型,如果遇到问题,能够从抽象模型中寻找解决方法”。
这个定义影响到以后30年智能机器人的研究方向。
1959年德沃尔与美国发明家约瑟夫·英格伯格联手制造出第一台工业机器人。
随后,成立了世界上第一家机器人制造工厂——Unimation公司。
由于英格伯格对工业机器人的研发和宣传,他也被称为“工业机器人之父”。
1962年美国AMF公司生产出“VERSTRAN”(意思是万能搬运),与Unimation公司生产的Unimate 一样成为真正商业化的工业机器人,并出口到世界各国,掀起了全世界对机器人和机器人研究的热潮。
1962年-1963年传感器的应用提高了机器人的可操作性。
人们试着在机器人上安装各种各样的传感器,包括1961年恩斯特采用的触觉传感器,托莫维奇和博尼1962年在世界上最早的“灵巧手”上用到了压力传感器,而麦卡锡1963年则开始在机器人中加入视觉传感系统,并在1965年,帮助MIT 推出了世界上第一个带有视觉传感器,能识别并定位积木的机器人系统。
《新一代人工智能发展规划》解读—人工智能的过去、现在和未来前言:人工智能的概念及发展历史一)人工智能的概念人工智能:以机器为载体的智能,是相对于人类智能和动物智能,也叫机器智能。
2017年7月20日发布《新一代人工智能发展规划》(国发〔2017〕35号)一)人工智能的概念。
人工智能的迅速发展将深刻改变人类社会生活、改变世界。
三个阶段的目标:2020年:与世界先进水平同步2025年:部分达到世界领先水平2030年:总体达到世界领先水平(二)世界各国高度重视人工智能的发展方向美国:2016年10月,美国连续发布两个重要战略文件《为人工智能的未来做好准备》和《国家人工智能研究与发展战略规划》,将人工智能上升到国家战略层面。
美国有很多著名的IT跨国企业,如谷歌、Facebook、微软、IBM等,都将人工智能技术作为企业的核心战略,持续投入巨资并招聘领军人才,强力涉足该领域。
在技术方向上,美国将机器人技术列为警惕技术,主攻军用机器人技术。
人工智能技术使五角大楼重新调整了人和机器在战场上的位置,这些新武器的速度和精确度都会大大提高,可以大幅减少士兵伤亡。
日本:日本政府将人工智能定位为增长战略的支柱,提出“机器人驱动的新工业革命”。
日本文部科学省计划在今后10年投入1000亿日元,用于人工智能的研发,在东京建立研究基地。
日本在2017年度预算中,对人工智能的研究是924亿日元,是2016年预算的9倍。
欧洲:欧盟2013年启动人脑计划,为期10年,欧盟和参与国投入近12亿欧元经费,在2024年设计出能够模拟人脑运作原理的超级计算机。
英国:2012年,英国政府把人工智能及机器人技术列为国家重点发展的八大技术之一。
2015年出台了《英国机器人及自主系统发展图景》。
2016年,英国政府科学办公室发布了《人工智能:未来决策制定的机遇与影响》。
目前,英国已经把人工智能列为战略性和尖端科技的重中之重,力图抢占人工智能发展的制高点。
我与《公关世界》30年——风雨兼程 砥砺前行侯向平:《公关世界》创刊至今,已走过了30个春秋。
在这过去的30年里,可以毫不夸张地说,信息通讯与传播领域发生了翻天覆地的变化。
在公关、传播等领域摸打滚爬、自己坚守了30多年,可以说是与《公关世界》同进步、共成长。
就企业公共关系30多年的经历而言,这个挑战主要来自于一个复杂的、不断变化的信息通讯技术及其环境。
最大的体会是:回顾30年来,企业公关领域进行多学科的运用和实践,其动力源自于公关本身不断发展以及所面临的现实挑战,具体体现在信息技术及其社会发展对传统的公关、传播活动的形式及所发挥的作用影响、机会和压力;可以预计,数字中国建设将对企业公共关系新的发展产生深刻地影响。
侯向平:如果你是一位企业公关、传播的从业者,需要时刻关注外部环境对于这个行业所可能带来的影响,以信息通讯技术为例,不断变化的技术不仅改变了传播者接触目标受众(无论是企业、政府还是个人)的方式,它还改变了观众接收和反应信息的方式。
你需要掌握能为你所用的相关技能:● 向未来的雇主推销自己。
● 向潜在的客户推销一个组织的产品、服务及其品牌等。
● 赞扬一个公司的产品。
● 试图说服一个媒体编辑、记者写一篇关于你的客户的报道。
编者按:侯向平,资深公关人,在大型国企、TOP合资企业从事企业宣传、公共关系与传播超过30年工作经历。
曾在专业期刊上发表文章,在企业形象品牌与识别、品牌及产品危机、危机管理与危机传播、广告与公共关系诉讼、企业战略传播积累了大量的实践经验,目前主要研究方向是传播计算、公共关系与算法、创新数字化方法和技术对传播和媒介的影响等。
他是中国国际公共关系协会会员、上海市公共关系协会会员、中国公共关系协会第六届理事会理事。
在《公关世界》创刊三十周年之际,记者就公共关系的实践、在新时期遇到的挑战、公关从业人员需要具备的技能等对其进行了专访,与读者分享。
侯向平:回顾30年的工作历程,如何在不断变化的环境中,持续进行有效的沟通是重中之重,有效性沟通一直是企业公共关系KPI的优先项。
Google VS 微软云端对决Google与微软在云计算时代的争霸中必然掀起一场壮观的对决,而眼下仅仅只是一个开场。
它们越变越小,分布也越来越广。
现在,它们开始逐渐消失,但你却能从世界任何一个角落连接到它们。
别误会,这不是科幻小说的开头,我们只是简要描述一下计算机的未来。
目前有一种流行的说法:未来全世界只有五台计算机,Google一台,IBM一台,Yahoo一台,Amazon一台,微软一台。
但是,这不妨碍你遨游网海,是因为“云端计算”将会把一切变成现实。
尽管“Cloud Computing(云端计算)”的提出只有短短一年时间,但其在IT产业掀起的风浪却令人叹为观止。
且不论追随各领域霸主步伐的中小厂商,仅仅同台竞技的千亿级企业都是趋之若鹜。
IBM推出了“蓝云”计划,着手在全球数个城市建立云计算中心;亚马逊在原有的EC2(Elastic Compute Cloud,弹性计算云)业务基础上提出了Amazon Web Services(亚马逊网络服务),全面进军云计算;SUN宣布了“黑盒子”计划,苹果推出了名为“Mobile Me”的云计算业务;惠普、英特尔、雅虎、戴尔等巨头也纷纷试水云计算,就连AT&T也以电信业者的身份签约美国奥林匹克委员会,提供奥运会转播的云计算服务。
这其中自然也少不了Google和微软的身影。
与其他参与云计算博弈的巨头相比,二者更贴近消费者,加之领域相近,竞争自然也更为激烈。
近几个月来,双方相继推出一系列重大举措,在固守自己优势的同时向对方的领域发出了挑战。
Google:发力终端“云端计算”源于Google青年工程师克里斯托弗?比希利亚所做的“Google 101”项目。
从“Google 101”开始,Google 就致力于把PC等终端设备里的数据和运算能力搬上网,目前已建成数个超级数据中心,拥有数十万台服务器,形成了强大数据存储和计算能力。
“我们讲云端计算,这个端是云上面的意思,并不是终端的意思。
人机交互30年人机交互30年自1982年ACM成立人机交互专门兴趣小组SIGCHI(Special Interest Group on Co mputer-Human Interaction)以来,人机交互(Computer-Human Interaction,CHI)已走过了近30年历程。
键盘的出现,将计算机带入了字符用户界面时代。
1964年,美国人道格·恩格尔巴特(Doug Engelbart)发明了鼠标(图1),图形用户界面(Graphical User Inter face,GUI)随之出现,才有了计算机的主机时代和个人计算机时代,为此,恩格尔巴特也获得了1 997年的图灵奖。
自图形用户界面出现至今的几十年中,人机交互技术经历了几代人的努力,成就了PC时代的辉煌。
图1 Doug Engelbart和他发明的鼠标70年代Xerox研究中心的Alan Kay提出了Smalltalk面向对象程序设计等思想,并发明了重叠式多窗口系统。
1989年Tim Berners-Lee在日内瓦的CERN用HTML及HTTP开发了WWW网,随后出现了各种浏览器(网络用户界面),使互联网飞速发展起来。
图2 Alan Kay和Tim Berners-Lee由于笔式交互、触摸、语音、以及基于视频等自然交互设备的出现,新的计算模式被提出,人机交互进入了普适计算(Pervasive Computing)时代。
90年代美国麻省理工学院N.Negroponte领导的媒体实验室在新一代多通道用户界面方面(包括语音、手势、智能体等),做了大量开创性的工作。
90年代美国Xerox公司PARC的首席科学家Mark Weiser首先提出“无所不在计算(U biquitous Computing)”思想。
人机交互是研究人类所使用的交互式计算系统的设计、实施、评估以及相关主要现象的学科,用户界面(User Interface,UI)是人与计算机之间传递、交换信息的媒介和对话接口,是计算图4 人机交互的适应发展图5 传统WIMP界面范式的交互过程人机交互大师Turk曾给自然地用户界面下过如下定义:最自然的人机交互技术是指那些能够利用人类自然地认知和感知能力、社会技能以及我们从小就养成的行为习惯。
由图6的五种人的感知通道所衍生出的界面形式称为可感知用户界面(Perceptual User Interface, PUI)图6 PUI的几种感知通道可感知用户界面(PUI)目前主要集中在以下几大领域:触控交互、笔式交互、机器视觉交互、语音交互、脑-机交互、其他传感器类交互以及多通道交互领域。
触控交互技术已普遍渗入到人的生活当中,触控手机和平板电脑就是这类交互技术的应用实例。
美国苹果公司(Apple)将电容屏应用到智能手机当中,推出了iPhone、iTouch以及iPad智能手机和智能平板电脑系列,随后这种触控交互的电子产品风靡全球,几乎将现在所有的智能手机的交互方式都更新了一遍。
图7 iPhone和iPad微软(Microsoft)是多点触控技术的先行者,Microsoft Surface强调使用更为直觉,不需使用任何鼠标及键盘。
搭配30寸的大型显示器,其机构外型很像张桌子,可以同时让很多人在上面触控操作。
与一般触控式电脑最大不同在于提供了多点触控(Multi-Touch)功能,可以同时辨识多点的触控资讯,可让多人同时使用一台Surface电脑。
严格意义上来讲,像Surface这类交互设备应属于机器视觉交互的范畴,图8右图是Surface的内部构造,它是由位于底部的一个摄像机来获取到人手指的位置和运动信息然后进行分割识别处理而得到交互语义的。
但是在交互过程中不存在机器视觉交互的“金手指”问题,所以它更具备触控交互的特点。
图8 微软Surface应用和构造笔式交互技术应该也属于触控交互,但由于在交互设备上需要用一支电子笔,所以将其单独划为一类。
“汉王”的手写设备就是这类交互方式的典型代表。
这类设备和上面的触控设备相比不同处除了多了一只电子笔外,其所用的触屏多是电阻屏。
笔式交互提倡回归文明、回归自然,特别是对于具有悠远文字文明的我们,笔式交互让我们更贴近汉字文明。
图9 笔式手写设备视觉通道是人与人之间进行交流的一种重要途径,尽管有很多其他方法可以替代视觉进行交流,但人们更原意采用可视的途径交流,因为这样更符合人们的交流习惯-面对面的交流。
基于视觉的交互也称为基于视觉的用户界面(Vision Based Interface, VBI),在人机交互上下文环境中,使用计算机视觉技术来感知用户称为基于视觉的交互。
VBI是PUI的一个研究子域,它更多地关注于用户的视觉感知行为。
这是一个多学科交叉领域,它结合了计算机视觉、图像处理、模式识别、人机交互、行为心理学等研究成果。
视觉用户界面试图回答以下问题【Turk 1998】1、存在和位置:有人在那里么?有多少人他们在哪里?[人脸检测、身体检测、头部和身体跟踪]2、身份:他们是谁?[人脸识别、步态识别]3、表情:用户正在微笑、皱眉、大笑还是说话?[面部表情识别、表情建模和分析]4、注意焦点:用户正在看什么?[头部/面部跟踪,目光跟踪]5、身体姿势和运动:用户的整体姿势和运动是什么?[身体建模和跟踪]6、手势:用户的头部、手、身体的运动表达了什么样的语义信息?[手势识别、头部跟踪]7、行为:用户正在做什么事情?[人体运动分析]利用视觉手势可以方便、有效地完成以下任务:1、代替鼠标完成指点和勾画任务;2、虚拟环境中漫游以及操纵虚拟对象;3、控制家电设备(例如电视、CD播放机等)和指挥机器人;4、通过手语进行交流。
目前,基于视觉的交互是人机交互领域的一个研究热点。
如智能相机、Anote 数码笔以及微软的XBOX体感游戏机都是这一领域的研究成果。
严格地讲,Anote数码笔虽然采用了视觉处理技术,但应该属于实物操作界面(Tangible User Interface, TUI)的范畴。
实物操作界面倡导的是周围环境中的物体都是交互的接口(World will be interface.)。
Anote数码笔是由数码纸和数码笔组成的,所谓的数码纸就是普通的纸,数码笔就是一支普通的圆珠笔。
它通过微型摄相头读入笔尖高速书写的笔迹和Anote 数码纸的微点坐标,微处理器分析处理后通过蓝牙无线或USB等方法转送到电脑或携带手机之中。
们只需用「Anote 数码笔」在「Anote 数码纸」上与平常一样书写与记录、就可以将信息简便的输入电脑。
图10 Anote数码笔和TUI交互视觉交互技术的另一项商业化应用就是东芝公司推出的具有手势识别功能的笔记本。
东芝Qos mio G55可通过摄像头来识别用户的手势,之后软件可把手势转换成指令进行相关操作。
用户通过手势可进行音乐、视频播放以及PowerPoint演示等操作,使用者在摄像头前3英尺到10英尺的范围内做出手势便可。
(1)(2)(3)图11 (1)为东芝Qosmio G55可手势识别笔记本;(2)CamSpace;(3)微软体感交互家庭游戏机。
由CamSpace小组开发的视觉交互软件基于实际物体的颜色特征,可在短时间内创建一个自己的游戏控制器。
真正做到了“any game, any webcam”。
只是精确度上要比任天堂的WII手柄略逊一筹。
视觉交互领域另一个不得不提的里程碑式的应用就是微软的体感控制器KINECT,它将以色列人的深度传感器推向了商业化应用。
KINECT的出现弥补了彩色摄像头的不足,使得普通摄像头下无法解决的难题迎刃而解。
自从2011年11月KINECT发布以来,这项技术已被应用到诸多领域,而且以后还会得到更长远的发展。
KINECT是一款基于Light Coding技术的立体成像传感器。
它可以实时(目前是每秒30帧,实际应该比这个还要高)地捕获到空间的三维信息。
微软将其用于对人体动作的识别领域,通过肢体分割和动作识别可以分析出人的动作然后转化成相应的控制信号对虚拟人物或其他设备进行控制。
语音交互技术已发展多年,微软的Windows操作系统从Vista版本以后都集成了语音指令操作功能。
用户可以通过语音操作指令来完成基本的操作功能,如打开文件、输入字符等。
其实,微软在早期就发布了TTS(Text to Speech)语音发音包和语音识别包,开发者可以利用这两个语音包实现语音发音和语音识别的功能;此外,IBM/Via Voice连续中文语音识别系统经过不断改进,也已广泛应用于Office/XP的中文版等办公软件和应用软件中,在中文语音识别领域有重要影响。
图12 语音识别脑-机交互目前只能在实验室中见到,脑-机交互也称之为“意念交互”、脑-机接口(Brain-com puter interface, BCI)。
利用脑电信号实现人脑与计算机或其他电子设备的直接通讯和控制。
BCI技术结合了神经科学、心理认知科学和智能信息处理等领域的最新成果。
图13 脑-机交互除了上述的交互领域,我们还会看到很多基于其他传感器的交互方式,如任天堂的WII操作手柄。
这是一款主要面向游戏娱乐的操作设备,它里面包含了固态加速计和陀螺仪,可以实现倾斜和上下旋转、倾斜和左右旋转、围着主轴旋转(像使用螺丝刀)、上下加速度、左右加速度、朝向屏幕加速和远离屏幕加速等功能。
类似的设备在现实中也较为常见,如PPT控制器也属此类,一般通过蓝牙技术与主机进行通信。
图14 WII手柄和WII操作场景多通道交互(Multi-Modal Interaction, MMI)是一种使用多种通道与计算机通信的人机交互方式。
采用这种方式的计算机用户界面称为“多通道用户界面”。
通道(Modality)这个词源于心理学的概念,涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如言语、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉或味觉等。
按照摩尔(Moore)定律,计算机硬件每18个月就翻新一代,计算机软件每5年升级一代,而用户界面则要15到20年更新一代。
迄今为止,用户界面的发展经历了三个主要的时代。
这三个时代可以用三种截然不同的界面风格来划分。
每一种界面风格都持续了若干年,并不断被当时新的硬件技术所优化,然后形成进入下一个时代。
每一个新的时代都较前一个时代而言,能更大限度地拓展人机交流的带宽,提高用户的生产力。
在60年代到70年代,用户界面主要是字符界面,键盘是主要的交互设备;80到90年代进入了图形用户界面时代,鼠标作为主要的指点和定位设备;2 1世纪将会进入用户界面的新时代。
图15 人机交互范式和用户的生产力计算机的运算速度、存储能力、以至整体计算能力一直在按照Moore定律成倍翻新。