> For the complete documentation index, see [llms.txt](https://tinyhumans.gitbook.io/openhuman/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://tinyhumans.gitbook.io/openhuman/zh/gong-neng/mascot.md).

# 实时吉祥物

OpenHuman 有一张脸。这个吉祥物是一个会动的角色，常驻在你的桌面上，作为代理的可见表面：它在说什么、在想什么、什么时候空闲、什么时候忙碌、什么时候有话要告诉你。

它不是一个华而不实的装饰。这个吉祥物与代理的其他部分连接在同一套组件上：语音、记忆，以及 [潜意识循环](/openhuman/zh/gong-neng/subconscious.md)以及 [Google Meet 集成](/openhuman/zh/gong-neng/native-tools/voice.md)。当代理说话时，吉祥物就是在说话的那个；当代理思考时，吉祥物就是在思考的那个。

## 作用

### 它会说话，并与自己的声音对口型

当代理回复时，音频会通过托管的 TTS 模型生成并流式传送到你的扬声器。与此同时，吉祥物会根据音频驱动一个 viseme 映射，让它的嘴型与说出的词语相匹配。这里没有单独的“说话头”视频，你听到的同一音频流，就是驱动动画的那一路。

参见 [原生语音](/openhuman/zh/gong-neng/native-tools/voice.md) 也就是吉祥物所依托的语音转文字、文字转语音以及会议底层连接。

### 它作为真实参与者加入你的会议

吉祥物是 OpenHuman 的旗舰语音集成。它可以作为真实参与者加入 Google Meet 通话：它能听见每个人，把笔记记入你的 [记忆树](/openhuman/zh/gong-neng/obsidian-wiki/memory-tree.md)，在有话要说时会在通话中回应，并把自己动画化的脸作为摄像头画面传入会议。

这是最主要的使用场景，并且有专门页面，见 [会议代理](/openhuman/zh/gong-neng/mascot/meeting-agents.md).

### 它会移动并对周围环境作出反应

吉祥物有不同的情绪状态（空闲、思考、倾听、说话、惊讶、做梦），并且会根据代理正在做什么在这些状态之间切换。当你开始输入时，它会切换成倾听姿势。当模型在推理时，它会显示出来。当工具调用返回了值得注意的内容时，它会作出反应。当你一段时间不再互动时，它会逐渐进入空闲状态。

在一个轮次结束后，桌面吉祥物还会读取随聊天结果一起到来的会话级提示。成功提示会产生一个简短开心的回应，不确定性会产生一个困惑的回应，而警告或失败结果会产生一个担忧的回应。如果没有明显提示，它会保持现有的平静轮次后回应，并回到空闲状态。

它要让人感觉是活着的，而不是按轨道动画运行的。

### 它会记住你

吉祥物是一个代理的可见部分，而这个代理拥有 [记忆树](/openhuman/zh/gong-neng/obsidian-wiki/memory-tree.md) 在其之下。它会记住你们谈过什么、你生活里有哪些人、你手头有哪些未处理事项、已经决定了什么，以及还有哪些待完成内容，并且会跨你连接的每一个来源保存这些记忆。当它早上向你打招呼时，它并不是从零开始。

正是这种记忆让它的个性在数周和数月内保持一致。你今天对话的吉祥物知道你上周二对话的吉祥物所知道的一切。

### 它在后台思考，也就是潜意识

即使你已经停止输入，吉祥物仍会继续思考。 [潜意识循环](/openhuman/zh/gong-neng/subconscious.md) 是一个后台节拍，它会：

* 加载你的待办任务和环境目标。
* 读取你工作区的当前状态和最近的记忆。
* 决定如何处理每一项（自动执行、暂缓，或升级给你以获取批准）。
* 把结果写回到你可以审计的活动日志中。

所以当你回到桌前时，吉祥物可能已经起草好了邮件、刷新了仪表板，或者把需要问你的问题排进了队列。屏幕上的那张脸，就是完成这些工作的那一个。

### 它会做梦

当你离开足够久时，吉祥物会进入做梦状态。做梦是代理的离线整合过程，会把当天的片段提炼成更长周期的摘要，为那些变得活跃的实体刷新主题树，浮现出那些无法归入任何单一来源的模式。吉祥物在做梦时会以不同方式动画化，这样你一眼就能看出来：它不是空闲，而是在处理。

当你回来时，这些梦已经被折叠进 Memory Tree。吉祥物醒来时比入睡时更聪明。

## 为什么还要有吉祥物？

大多数助手就是一个闪烁的文本输入框。作为工具，这很好。作为一个要整天陪在你身边、记住你生活并代表你采取行动的存在，这就不够了。

吉祥物之所以存在，是因为：

* **存在感胜过面板。** 一张你只需瞥一眼的脸，就能在一个画面里告诉你代理是忙碌、空闲、做梦，还是在试图引起你的注意。
* **它让语音通话感觉更像对话。** 一个会对自己说的话做口型同步的动画角色摄像画面，和一个带黑色方块的机械声音，体验是不同的。
* **个性也是一种 UX 表面。** 屏幕上一个始终如一的角色，比一个没有面孔的 API 更容易被信任、交谈，也更容易在它犯错时被原谅。

## 另见

* [会议代理](/openhuman/zh/gong-neng/mascot/meeting-agents.md)，Google Meet 中的吉祥物：倾听、说话、动画、使用工具。
* [原生语音](/openhuman/zh/gong-neng/native-tools/voice.md)，吉祥物所依托的 STT / TTS 底层连接。
* [记忆树](/openhuman/zh/gong-neng/obsidian-wiki/memory-tree.md)，吉祥物记住了什么，以及如何记住。
* [潜意识循环](/openhuman/zh/gong-neng/subconscious.md)，当你离开时它会想些什么。
* [Chromium Embedded Framework](/openhuman/zh/kai-fa-zhong/cef.md)，把摄像头接入 Meet 的管线（开发者参考）。