人机交互期末复习
绪论
什么是人机交互
人机交互(HCI:human computer interaction)是指关于设计、评价和实现供人们使用的交互式计算机系统,并围绕相关的主要现象进行研究的学科。
人机交互和软件工程的区别与联系
从人机交互工程师(用户视角)和软件工程师(技术角度)的角度来看,人机交互与软件工程在设计上有以下不同观点:
- 需求分析:
- 人机交互工程师:注重用户需求和期望。他们关注用户如何与系统交互,用户的行为模式,用户的心理模型等。他们通过用户研究、用户调查和用户测试等方法来理解用户需求,并将这些需求转化为可用性要求和界面设计指导。
- 软件工程师:注重系统功能和技术实现。他们关注软件系统的功能需求、数据处理和算法等。他们通过与领域专家和业务分析师合作,以及使用需求工程技术来定义和规划系统功能。
- 软件设计:
- 人机交互工程师:关注用户体验和界面设计。他们着重于设计用户界面,包括布局、交互元素、导航结构等,以提供直观、易用和满足用户期望的界面。他们通常使用用户中心的设计方法,如人机交互原型、用户故事板等。
- 软件工程师:关注系统架构和模块设计。他们考虑软件系统的结构、组件和模块之间的关系,并设计合适的软件架构以实现系统的功能需求。他们通常使用面向对象设计、设计模式等技术来构建可维护和可扩展的软件。
- 评估方式:
- 人机交互工程师:注重用户反馈和用户测试。他们通过用户测试、用户调查、用户观察等方法来评估界面的可用性和用户满意度。他们关注用户在使用界面时的反应和行为,并根据这些反馈来改进设计。
- 软件工程师:注重功能测试和性能测试。他们通过单元测试、集成测试和系统测试等方法来评估软件的功能是否符合需求,以及性能是否满足要求。他们关注软件系统的正确性、可靠性和效率等方面。
综上所述,人机交互工程师和软件工程师在需求分析、软件设计和评估方式等方面有不同的观点。人机交互工程师着重于用户需求和体验,关注用户界面的设计和用户反馈;而软件工程师则注重系统功能和技术实现,关注软件系统的架构和功能实现。
| 人机交互工程师(用户视角) | 软件工程师(技术角度) | |
|---|---|---|
| 需求分析 | 注重用户需求和期望 | 注重系统功能和技术实现 |
| 软件设计 | 关注用户体验和界面设计 | 关注系统架构和模块设计 |
| 评估方式 | 注重用户反馈和用户测试 | 注重系统功能和性能测试 |
第一章
可用性
关于交互系统的可用性,国际标准化组织(ISO)在其 ISO FDIS9241-11 标准(Guidance onUsability 1997)中认为可用性是指当用户在特定的环境中使用产品完成具体任务时交互过程的有效性、交互效率和用户满意度。
有效性:用户完成特定任务和达到特定目标时所具有的正确和完整程度
效率:用户完成任务的正确和完整程度与所使用资源(如时间)之间的比率
用户主观满意度:用户在使用产品过程中所感受到的主观满意和接受程度
交互设计领域有丰富的理论沉淀,最著名和经典的理论当属人机交互大师雅各布·尼尔森(Jakob Nielsen)博士在 1995 提出的尼尔森十大可用性原则(Jakob Nielsen’s Ten UsabilityHeuristics),该理论是针对 PC 端交互设计提出的,但同时也适用于移动端交互设计。
可用性度量
- 学习时间
- 运行速度
- 用户出错率
- 记忆保持时间
- 主观满意度
支持可用性的设计原则
可学习性
- 可预见性
- 同步性
- 熟悉性
- 通用性
- 一致性
灵活性
- 可定制性
- 对话主动性
- 多线程
- 可互换性
- 可替换性
鲁棒性
- 任务规范性
- 可观察性
- 响应性
- 可回复性
第二章
通用性目标
满足所有用户的需求
针对设计(特征,如何设计)
三个典型的用户:残疾 老年 儿童
- 残疾用户
- 视觉障碍者(文本转成语言),听觉障碍者(语音转文本),身体障碍(语言输入设备、人眼凝视技术等)
- 用脑机接口等高科技手段,帮助高度残疾或者其他特殊人群(比如渐冻症患者)使用计算机。
- 老年用户
- 界面使用更大的字体,更明显的图标,提高音量,方便老年用户进行操作。
- 减少动画的干扰,增加界面的色彩饱和度。
- 包含语音交互的模式,降低操作精度,减少老年用户的点触。
- 儿童用户
- 降低操作精度,减少精确的操作,比如区域化选择对象、时效性拖动对象等操作,从而提升儿童用户的体验乐趣。
- 更多的使用形象化的、生活化的图形界面设计,减少同一化的、相似的、抽象的概念图形,让界面对儿童用户更加有吸引力。
- 简化应用流程,降低应用程序逻辑的复杂度。
第三章
什么是指南
指南(Guidelines)是基于研究和实践经验,为设计师提供的关于设计和交互的建议和准则。它们旨在帮助设计师设计出易用、可访问和符合用户期望的界面。
三个常用的指南
用户界面设计指南:这些指南侧重于界面设计的方面,包括布局、颜色、图标、字体等。它们提供了关于用户界面设计的准则,以确保用户界面的一致性、可用性和可理解性。
交互设计指南:这些指南关注用户与界面的交互方式,包括操作流程、交互元素的行为和反馈等。它们提供了设计交互行为和动画、用户输入和操作的准则,以增强用户体验和界面的可操作性。
可访问性指南:这些指南旨在确保用户界面对于各种能力水平和使用辅助技术的用户都可访问。它们提供了设计和实施无障碍功能的准则,如可访问的标记语言、键盘导航、视觉辅助等。
四个具体的指南
苹果人机界面指南:这是苹果公司为开发iOS和macOS应用程序的设计师提供的指南。它包含了关于用户界面、交互和设计的准则,帮助设计师构建与苹果平台一致且符合用户期望的应用程序。
谷歌材料设计指南:这是谷歌为开发Android应用程序和Web应用程序的设计师提供的指南。它提供了关于界面设计、交互模式、动画效果等方面的准则,以创建具有谷歌风格的现代化应用程序。
微软用户体验指南:这是微软为开发Windows应用程序的设计师提供的指南。它包含了关于界面设计、交互模式、可访问性和多语言支持等方面的准则,以确保应用程序在Windows平台上具有良好的用户体验。
W3C Web内容可访问性指南:这是由万维网联盟(W3C)制定的一套关于Web内容可访问性的指南。它提供了关于Web内容的可访问性准则,以确保Web页面和应用程序对于不同能力的用户都可访问。这些指南涵盖了标记语言、媒体、表单、键盘导航等方面的要求。
界面设计8条黄金法则
- 坚持一致性。
- 常用操作要有快捷方式。
- 提供信息反馈(告知状态及操作)。
- 设计对话框产生结束信息(反馈结果)。
- 预防错误(避免用户犯错)。
- 提供回退操作。
- 用户掌握控制权(给予用户选择的权力)。
- 减少短期记忆负担。
图形用户界面的3个思想
- 桌面隐喻
- 所见即所得
- 直接操纵 >直接操纵是指可以把操作的对象、属性、关系显式地表示出来,用光笔、鼠标、触摸屏或数据手套等指点设备直接从屏幕上获取形象化命令与数据的过程。
5种交互风格
- 直接操作
- 菜单选择
- 表单填写
- 命令语言
- 自然语言

第四章
设计进程(大题)
- (用户)需求分析
- 概要和详细设计
- 构造与实施
- 评估
任务分析(必考)
- 使用行为分析
- 要理解系统中每个参与者及其所需完成的任务,一般使用用例图描述

- 要理解系统中每个参与者及其所需完成的任务,一般使用用例图描述
- 顺序分析
- 每个使用行为都是由若干步骤组成的,这些步骤可以使用顺序图进行描述
- 用例常常被细化为一个或更多的顺序图

- 协作关系分析
- 注重某个用户行为中各个系统元素之间的关系,而不再重点强调各个步骤的时间顺序。

- 注重某个用户行为中各个系统元素之间的关系,而不再重点强调各个步骤的时间顺序。
设计框架(三种设计)
- 以用户为中心的设计 (UCD)
- 在设计过程的每个设计阶段都考虑到最终用户的需求、想法和局限性。
- 四大原则
- 及早以用户为中心: 设计人员应当在设计过程的早期就致力于了解用户的需要。
- 综合设计: 设计的所有方面应当齐头并进发展,而不是顺次发展,使产品的内部设计与用户界面的需要始终保持一致。
- 及早并持续性地进行测试: 当前对软件测试的唯一可行的方法是根据经验总结出的方法,即若实际用户认为设计是可行的,它就是可行的。通过在开发的全过程引入可用性测试,可以使用户有机会在产品推出之前就设计提供反馈意见。
- 反复式设计: 大问题往往会掩盖小问题的存在。设计人员和开发人员应当在整个测试过程中反复对设计进行修改。
- 参与式设计 (PD)
- 人们直接参与到他们所用产品和技术的协同设计中。
- 敏捷交互设计
- 表示一类适用于团队开发的方法,目的是确保灵活性、适应性,并快速对不断变化的需求做出快速反应,并以渐进式开发为基础。
第五章
专家评审和启发式方法(概念,方法)
启发式
以一种快速的看起来不费力的方式做复杂的决定或进行推论时应用的一些简单规则。
启发性评估的两大原则
- 不能是设计师本人
- 具有可用性知识
优缺点 优点:成本低、效率高、可以发现大多数可用性问题。 缺点:不能代表真实用户、比较主观;有时发现问题过多;对评估者的要求较高。
专家评审
以专家为索取未来信息的对象,组织各领域的专家运用专业方面的知识和经验,通过直观的归纳,对预测对象过去和现在的状况、发展变化过程进行综合分析与研究,找出预测对象变化、发展规律、从而对预测对象未来的发展与实际状况做出判断。
流程:使用某种方法,遍历界面中的所有功能,在较短时间内给出评审结果,通常是一份正式报告书。
可用性评估方法(诊查、测试式方法)
- 诊察式
- (1) 用户模型法 基于用户模型来评估界面的可用性。评估者通过分析用户的特征、目标、需求和行为模式,识别潜在的设计问题和改进机会。
- (2) 启发式评估 由专家评估界面设计并应用启发式评估原则,如Nielsen的十项启发式评估,以识别潜在的设计问题和改进点。
- (3) 认知性遍历 评估者按照用户的认知过程,逐步浏览界面并考虑用户可能的行为和决策,以评估界面的可用性和用户体验。
- 测试式
- (1) 用户测试 让真实用户执行特定任务或场景,通过观察和记录他们的行为、反应和问题,来评估界面的易用性和用户体验。
- (2) 问卷调查 让真实用户执行特定任务或场景,通过观察和记录他们的行为、反应和问题,来评估界面的易用性和用户体验。
- (3) 放声思考法 让真实用户执行特定任务或场景,通过观察和记录他们的行为、反应和问题,来评估界面的易用性和用户体验。
- (4) 访谈法 与用户进行面对面或远程访谈,通过提问和讨论的方式,深入了解他们的需求、期望和体验,以评估界面的可用性和用户满意度。
第六章
敏捷交互设计(过程)
敏捷设计以用户的需求进化为核心,采用迭代、循序渐进的方法进行软件开发在敏捷设计中,软件项目在构建初期被切分成多个子项目,各个子项目的成果都经过测试,具备可视、可集成和可运行使用的特征。换言之,就是把一个大项目分为多个相互联系但也可独立运行的小项目,并分别完成。在此过程中,软件一直处于可使用状态
- 快速迭代。相对那种半年一次的大版本发布来说,小版本的需求、开发和测试更加简单快速
- 让测试人员和开发者参与需求讨论。需求讨论以研讨组的形式展开最有效率,需要包括测试人员和开发者。这样可以更加轻松地定义可测试的需求,将需求分组并确定优先级。同时,该种方式也可以充分利用团队成员间的互补特性。
- 编写可测试的需求文档。开始就要用“用户故事”的方法来编写需求文档。这样可以将注意力放在需求上,而不是解决方法和实施技术上。过早的提及技术实施方案会降低对需求的注意力。
- 多沟通,尽量减少文档。在任何项目中,沟通都是一个常见的问题。好的沟通是敏捷开发的先决条件。在圈子里面呆得越久,越会强调良好高效的沟通的重要性。团队要确保日常的交流,面对面沟通比邮件强得多
- 做好产品原型。建议使用草图和模型来阐明用户界面。并不是所有人都可以理解一份复杂的文档,但人人都会看图
- 及早考虑测试。这在敏捷开发中很重要。在传统的软件开发中,很晚才开始写测试用例,这导致过晚发现需求中存在的问题,提高改进成本。较早地开始编写测试用例,这样当需求完成时,可以接受的测试用例也基本起完成了。
第七章
什么是直接操纵
指用户通过直接操作界面上的对象或元素来执行任务或操作的一种交互方式。用户可以通过手势、鼠标、触摸屏等方式与界面中的对象进行实时互动,直接看到操作结果的变化。
直接操纵的特点
- 是真实世界的扩展
- 操纵对象可见
- 可以增量操作 可看见前一个操作的结果,任务的进展是持续的
- 操作可逆 更方便地撤销错误的操作
直接操纵的平移距离(强中弱的例子)
直接操纵的平移距离:用户与隐喻的表现之间的平移距离,即隐喻的强度
- 强度可以通过从“弱”到“沉浸式”的过渡
- 还可进一步将其描述为用户的身体动作和虚拟空间中的动作之间的间接性水平
- 例子
- 弱:早期的电子游戏控制器。
- 中等:触摸屏,多点触摸。
- 强:数据手套,手势,操纵实物。
- 沉浸式:虚拟现实,如头戴式显示器。
直接操纵优缺点
优点
- 形象化地呈现任务概念
- 允许简单地学习
- 允许简单地记忆
- 允许避免错误
- 鼓励探索
- 提供较高的主观满意度
缺点
- 可能很难编写程序
- 需要特别注意可达性
什么是虚拟现实和增强现实
- 虚拟现实的远程呈现打破了空间限制,使得用户认为身处他处。
举例:虚拟现实可在外科医生或他们的助手进行手术时提供帮助,它能显示相关的手术信息,并在真实世界中显示
- 增强现实可以使用户看到叠加了附加信息的现实世界。
举例:使用增强现实叠加图,可以在手机上显示不同的感兴趣的热点,使用图标代表位置类型(食品、购物等)及与当前位置的距离。
第八章
导航种类
- 菜单栏,弹出菜单,工具栏,面板和功能区
- 快捷方式和快速交互手势
- 长列表
- 序列菜单与同步菜单
内容组织
要对有意义的菜单项来分组和排序,精心编辑标题和标签,适当的设计布局,可以缩短选择时间,提高用户满意度。
线性序列:按单一方向
层次结构:按照层级划分多个级别
菜单树的形成规则:
- 用任务语义组织菜单
- 限制层级数(例如,宁愿广而浅,而不窄而深)
- 创建逻辑上相似的选项组:例如,级别1:国家,级别2:州,级别3:城市
- 形成涵盖所有可能性的选项组:例如年龄范围:[0-9][10-19][20-29]和[>= 30]
- 保证选项不重叠,例如:用“音乐”和“运动”分类。而不用”娱乐”和“事件”分类
- 在每个分支上自然顺列项目(不按字母),或将相关项目分为一组。按使用频率排序菜单项比按类别或字母顺序排序更有用。
- 保持各项的顺序固定(否则在菜单的专用部分可能出现重复的频繁项)
网络结构:可以通过多个路径(例如网站)到达
- 对于层次结构,菜单广度优先比深度优先更好,即通过增加宽度来减少深度操作。 因为深度增加会导致导航的不可测和不稳定性。但也要同时考虑屏幕空间的限制。
- 排版的四个原则: 亲密性,对齐,重复,对比
第九章
语音识别(概念)
语音识别(ASR,Automatic Speech Recognition),就是将人的语音转换为机器可以识别并理解的文本或命令的过程。
- 语音输入:语音生成文本(快速录入、字幕自动生成、专业词汇更正)
- 语音命令:有效识别某些命令(语音助手)
- 对话翻译
口语交互优缺点及障碍
应用人群及场景
- 残疾用户、无法进行读写的用户(如儿童)
- 腾不出手的说话者
- 不断移动的人员
- 妨碍键盘使用的恶劣或狭小环境
- 词汇和任务有限的应用领域
优点
- 比打字快:听写比打字快,对用户来说更方便。
- 易用性:并非所有人都能很好地使用技术设备。但任何用户都可以使 用语音向VUI设备或AI助手请求任务。
- 免提:在某些情况下,例如开车、做饭或当你远离设备时,说话比打 字或敲击要实用得多。
- 免视:VUI 提供免视用户体验。在驾驶等情况下,你可以专注于道路 而不是设备。它对于屏幕疲劳问题也很实用。
缺点
- 嘈杂环境和劣质麦克风的干扰
- 命令需要学习和记忆
- 强烈的口音或不正常的词汇表会对识别产生影响
- 说话并非总是可被用户接受的(如在公共办公室中和会议期 间)
- 纠错很费时
- 与打字或指向相比,增加了认知负担
- 没有独特的定制功能,编程困难
障碍
- 与视觉显示相比,语音输出的速度较慢
- 语音具有短暂性
- 隐私问题:对VUI的潜在隐私侵犯涉及到一些用户。
- 误解和缺乏准确性:语音识别软件仍然存在缺陷。软件无法理解和解释 语言的环境,从而导致错误和误解。用于自动打字的语音听写可能会导 致打字错误,因为 VUI 可能并不总是区分同音异义词。
- 公共空间:由于隐私和噪音问题,很难向公共空间中的设备和 AI 助手发出语音命令。
语音生成的方法
- 语音合成(TTS,Text To Speech),就是将文字转换为声音输出的过程。
- 语音生成有三种常用方法:
- 峰段合成-通过一组基于文本语音表示的算法生成语音
- 串联合成-将事先录好的较短人类语音片段(音节)拼接为完整的 句子。
- 语音录音-可将各个语音片段(词语、短句)拼合在一起,形成更长的语 音片段
第十章
菲兹定律(概念+如何使用)
菲茨定律是用来预测从任意一点到目标中心位置所需时间的数学模型。它由保罗.菲茨在1954年首先提出。这个模型考虑了用户定位点的初始位置与目标的相对距离(D)以及目标的大小(W)。用于估算用户移动光标点击链接或控件按钮所需的时间。

其中:
- \(\color{red}T\):光标完成移动的平均时间
- \(\color{red}a\):光标开始/停止移动的时间
- \(\color{red}b\):光标移动的速度
- \(\color{red}D\):目标的相对距离
- \(\color{red}W\):目标的大小
意味着:
- 在页面中,大而近的目标意味着用户无需做过多精细的调整就能到达目标。
- 反之,小而远的目标则意味着要将鼠标移动较长一段距离,并可能要做一些列精细调整,会很耗时。
- 距离越近,初始动作因为幅度太大而超出目标区域的风险越小。
启示:
- 按钮加大,点击更容易。
- 让相关的内容靠得更近,增强用户在视觉上对其相关性的认知,并减少光标移动的距离和时间。
- 屏幕的边角很适合防止菜单栏和按钮,因为边角是巨大的目标,鼠标不会超过它们。
第十一章
协作模型7个维度 概念 例子
MoCA协同行为模型
MoCA是在中间层和宏观层面运行的现代框架。整合了传统模型,并将传统模型扩展为包含7个维度的一个集合。
协同:指“相互依赖的两名或多名参与者在各自的活动中,针对某个特定目标通过行为域叠加所做出的努力。

- 同步性:例如腾讯会议里面对面实时交流,同步性很大程度影响一次成功的协作的质量,假设网络连接中断,那么会议交流就会失去实时性,导致协作沟通存在延迟,影响协作质量。
- 物理分布:团队协作可以在多种场合实现,从共用一张办公桌到同一个房间、建筑、校园、城市、国家、大陆或星球。因此协作是物理分布的或者是有空间分布的。
例子:用户之间处于不同物理分布时,用户的协作方式会存在相应的变化,比如当用户物理位置在同一分布时(同一个房间,使用同一种语言),其协作沟通会更直接;而当其物理分布存在差异时(不同国家地区,使用不同语言),其协作会存在延迟,使用的交流工具也会变化(使用远程协作工具,翻译工具等)
- 规模:规模指参与人数或协作规模,是影响交互性质和类型的一个重要维度。例如,与一人协作撰写论文并在维基百科上发表,与 10 人或 100 人协作相比差别巨大。在传统的组织中,处理规模较大任务的典型做法是:引入分解任务的层次结构,并明确权责。
例子:公司企业存在协作规模,50 人的公司(小作坊)与上万人的企业协作相比差别巨大,小型公司部门较少,人员沟通交流更加密集直接,而大型企业部门数量多、跨度大,协作管理会更加困难,但是相应的协作交流的资源方式更加多样。
- 践社区数:实践社区指的是,随着时间的推移,若干人互为老师和学生,形成一致的价值观、规范和实践,进而形成一个小组。
例子:公司部门下,会有不同的项目小组,小组里有项目负责人与项目成员,成员也有各自不同的身份角色,随着工作时长的增加与项目的推进,项目小组会逐步形成完善对项目的理解与统一规范。实践社区数影响协作沟通的跨度与时空分布
- 起源:新团体不断涌现,并协调彼此之间的行为。 起源的含义是,协同行为已发展到何种程序,或协同行为还未建立而正在发展之中。
例子:公司成立新部门,新成立的部门需要与旧部门进行工作对接,需要与其他部门建立联系。起源影响协作的开始与发展计划。
- 持久性:有些协同行为是短期的,有些则是长期的。例如,应对危机事件可能要花几小时、几天、几个月甚至几年的时间。不论合作是临时型的还是永久的,参与者都需要建立共享的词汇库,协调工作实践和输出。
例子:项目计划存在计划持久性,项目不仅可以是同部门同项目小组成员之间的协作,也可以是跨部门跨项目协作,项目推进的时长影响协作的对象、时长、效率等等诸多方面,要求协作参与者之间需要建立共同的词汇库,协调工作实践和 输出。
- 人员调整率:人员调整率是指合作中人的稳定性,即新参与者加入协作和离开协作有多频繁、协调行为一方面必须为彼此协作,人员流失率很低。
例子:公司部门、部门项目小组招收新员工和老员工退出会影响协作的效率,新员工的加入需要时间适应学习,协作增加时间成本。老员工的退出需要建立工作对接,协作增加时间成本。低的人员调整率确保合作的高稳定性,协作沟通更有效率。
第十二章
网页设计十大错误
- 信息在网站中藏得太深。
- 页面加载了过多的内容。
- 提供的导航笨拙或令人困惑。
- 信息放到了页面之外。
- 链接不明显、不清楚。
- 显示信息的表格设计拙劣。
- 文本太小,导致很多用户无法阅读。
- 文本使用了用户无法阅读的颜色组合。
- 使用了很差的表单。
- 隐藏(或不提供)能帮助用户的功能。
非拟人化设计
将计算机呈现为人时,无论是合成人物还是卡通任务,均需谨慎。
- 设计可理解、可预测和可控制的界面。
- 利用适当的人来做音频或视频介绍或向导。
- 在游戏或儿童软件中使用卡通人物,但在其他地方应避免使用它们
- 提供以用户为中心的概要,用于概述性和总结性内容。
- 计算机响应人的动作时,不使用第一人称代词“我” 。
- 使用“你”来指导用户或仅陈述事实
第十三章
SRT(系统响应时间)的概念、影响因素
SRT的概念: 从用户发起动作(通常为触碰图标、按回车键或点击鼠标)到计算机开始呈现反馈结果所需要的秒数。
用户思考时间: 是从计算机响应到用户发起下一动作所花的秒数
网站SRT: 要了解交互对用户性能、态度、压力和行为意图的影响,就需要评估延时和网站广度和内容熟悉度,进而研究网站的显示性能。 因素包括:
用户搜索目标信息
网络
微小变化会对关键指标造成很大的影响
消费需求是提升性能的关键因素
预先存储用户账号信息(如送货地址)
影响用户对“SRT”的期望与态度的三个主要因素:以往的经验、个性的差异、任务的不同
第十六章
数据可视化的概念
数据驱动图片的想法,称为可视化。(也叫“视觉数据挖掘”)
- 可视化提供了紧凑的图形表示和用户界面,用于交互操作大量的项,这些项通常是从大型数据集中提取的。