# 实时吉祥物

OpenHuman 有一张脸。这个吉祥物是一个动画角色，常驻在你的桌面上，作为智能体可见的外在表现：它在说什么、在想什么、空闲时是什么状态、忙碌时是什么状态，以及什么时候有话要告诉你。

它不是一个纯装饰的浏览器图标。吉祥物与智能体其余部分使用同样的组件连接在一起：语音、记忆、 [潜意识循环](/openhuman/zh/gong-neng/subconscious.md)，以及 [Google Meet 集成](/openhuman/zh/gong-neng/native-tools/voice.md)。当智能体说话时，开口说话的是吉祥物；当智能体在思考时，正在思考的也是吉祥物。

## 它能做什么

### 它会说话，并与自己的声音同步唇形

当智能体回复时，音频通过托管的 TTS 模型生成并流式传输到你的扬声器。同时，吉祥物会根据音频驱动 viseme 映射，让它的口型与说出的词语相匹配。这里没有单独的“说话头部”视频，你听到的同一音频流就是驱动动画的音频流。

参见 [原生语音](/openhuman/zh/gong-neng/native-tools/voice.md) ，了解吉祥物所依赖的语音转文字、文字转语音和会议底层连接。

### 它作为真实参与者加入你的会议

吉祥物是 OpenHuman 的旗舰语音集成。它可以作为真实参与者加入 Google Meet 通话：它能听到所有人，把笔记写入你的 [记忆树](/openhuman/zh/gong-neng/obsidian-wiki/memory-tree.md)，在有话要说时回到通话中发言，并把自己动画化的面孔作为摄像头画面传入会议。

这是最核心的使用场景，并且有专门的页面，参见 [会议智能体](/openhuman/zh/gong-neng/mascot/meeting-agents.md).

### 它会移动并对周围环境作出反应

吉祥物有情绪状态（空闲、思考、倾听、说话、惊讶、做梦），并根据智能体正在做什么在这些状态之间切换。当你开始输入时，它会切换到倾听姿势。当模型在推理时，它会显示这一点。当某个工具调用返回了值得注意的结果时，它会做出反应。当你一段时间不再交互时，它会慢慢进入空闲状态。

一次交互结束后，桌面吉祥物还会读取随聊天结果一起到达的会话级提示。成功提示会产生一个简短开心的确认，含糊提示会产生困惑的确认，而警告或失败结果会产生担忧的确认。如果没有明显提示，它会保持现有的平静交互后确认状态，并回落到空闲。

它的目标是让人感觉它是活的，而不是按轨道预设动作的动画。

### 它会记住你

吉祥物是一个智能体的可见部分，而这个智能体有着 [记忆树](/openhuman/zh/gong-neng/obsidian-wiki/memory-tree.md) 其底层机制。它会记住你聊过什么、你生活中的人是谁、你手头有哪些待办、哪些事情已经决定、哪些事情仍未完成，贯穿你连接的每一个来源。当它早上向你打招呼时，它不是从零开始。

正是这些记忆让它的个性在数周和数月间保持一致。你今天与之交谈的吉祥物，知道你上周二交谈过的那个吉祥物所知道的一切。

### 它在后台思考，也就是潜意识

即使你停止输入了，吉祥物也会继续思考。 [潜意识循环](/openhuman/zh/gong-neng/subconscious.md) 是一个后台节拍，它会：

* 加载你固定的任务和环境目标。
* 读取你工作区的当前状态和最近记忆。
* 决定针对每一项该做什么（自主执行、暂缓，或升级给你审批）。
* 把结果写回到可供你审计的活动日志。

所以当你回到桌前时，吉祥物可能已经起草好了邮件、刷新了仪表盘，或者排好了它需要问你的问题。屏幕上的那张脸就是完成这些工作的那个。

### 它会做梦

当你离开足够久后，吉祥物会进入做梦状态。做梦是智能体的离线整合过程，会把当天的片段提炼成更长周期的摘要，刷新那些变得活跃的实体的话题树，浮现出那些无法归入任何单一来源的模式。吉祥物在做梦时会以不同方式动画化，因此你一眼就能看出：它不是空闲，而是在处理。

当你回来时，这些梦已经被整合进记忆树。吉祥物醒来时比入睡时更聪明。

## 为什么非要有吉祥物？

大多数助手只是一个闪烁的文本输入框。作为工具，这没问题。可如果它要整天陪在你身边，持续记住你的生活，并代表你采取行动，那就不够好了。

吉祥物之所以存在，是因为：

* **存在感胜过面板。** 一张你只需瞥一眼的脸，就能在一个画面里告诉你智能体是忙碌、空闲、做梦，还是在试图引起你的注意。
* **它让语音通话更像对话。** 一个动画角色对着自己的语音同步口型的视频画面，与一个黑色方块里的机械声音相比，是完全不同的体验。
* **个性本身就是一种 UX 表层。** 屏幕上一个始终一致的角色，比一个无面孔的 API 更容易被信任、交谈和在出错时原谅。

## 另请参见

* [会议智能体](/openhuman/zh/gong-neng/mascot/meeting-agents.md)，Google Meet 中的吉祥物：倾听、说话、动画展示、使用工具。
* [原生语音](/openhuman/zh/gong-neng/native-tools/voice.md)，吉祥物所依赖的 STT / TTS 底层连接。
* [记忆树](/openhuman/zh/gong-neng/obsidian-wiki/memory-tree.md)，吉祥物记住了什么，以及如何记住。
* [潜意识循环](/openhuman/zh/gong-neng/subconscious.md)，当你离开时它会思考什么。
* [Chromium 嵌入式框架](/openhuman/zh/kai-fa/cef.md)，摄像头到 Meet 的管线（开发者参考）。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://tinyhumans.gitbook.io/openhuman/zh/gong-neng/mascot.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
