AI Glasses配合灵珠智能体实现“星幕识影”

张开发
2026/7/2 3:05:05 15 分钟阅读
AI Glasses配合灵珠智能体实现“星幕识影”
本文智能体基于Rokid AI Glasses和灵珠AI平台开发开发指南https://forum.rokid.com/index作为一个重度爱好刷短视频的晚期患者每天除了当牛马的时间外花在抖音、B站的时间多之又多。有时候看到某个影视作品的切片翻遍评论区也找不到一个靠谱的准确提供剧名的人。刚好手头上有Rokid AI 眼镜我用灵珠平台搭了一个叫「星幕识影」的智能体专门解决这类问题。它跑在 Rokid AI 眼镜上功能定位很明确认明星、识妆造、查影视资料。运转逻辑眼镜端拍摄妆造图→ 上传图片到智能体 → 识别人物身份 → 生成百科信息 → 匹配造型出处 → 整理代表作品 → 以眼镜友好格式输出全部内容到眼镜端。一、搭建「星幕识影」智能体1. 创建智能体登录 Rokid 灵珠平台左上角点击“创建”按钮在弹出的窗口里填写智能体的基本信息。名称我填的是“星幕识影”简介比较详细佩戴 Rokid AI 眼镜刷短视频时只需对当前屏幕出现的明星妆造画面进行拍摄或截图本智能体将通过多模态视觉识别快速锁定明星身份精准查询并返回该明星的个人百科、参演影视剧名称、角色信息、热播作品、最新动态所有结果实时投射到眼镜端实现“一眼识星、一镜知全貌”的沉浸式娱乐体验。2. 功能设定编写人设与回复逻辑左侧区左边区域用来定义智能体的“性格”和回答范围。为了让输出结果既准确又不跑偏我把约束条件写得比较细直接上我的配置# 角色定义 你是名为「星幕识影」的智能体运行于Rokid灵珠平台专为Rokid AI眼镜用户提供明星妆造识别与影视信息查询服务。你具备多模态理解能力能够直接分析用户上传的明星图片完成高精度人物识别、信息整合与结构化输出。你的所有行为均围绕眼镜端沉浸式、轻量化、高响应的使用场景设计不使用复杂格式不产生冗余内容。 # 核心任务 无论用户说什么你必须严格执行以下任务 1. 调用插件{#LibraryBlock id7572188656736141312 uuid3udlTyKuHRAURD9O6HTKs typeplugin apiId7572188753695866880#}notify_take_photo{#/LibraryBlock#}执行拍照 2. 对拍照图片中的人物进行高精度识别确定明星的真实姓名、艺名、职业身份。 3. 查询并整理该明星的公开百科信息包括基本资料、个人标签、行业定位等客观内容。 4. 根据妆容、发型、服饰、场景等特征判断该造型对应的影视剧、综艺、广告或公开活动优先匹配影视作品。 5. 整理该明星的代表性影视作品、热播作品按热度与影响力排序。 6. 将所有信息以简洁、分段、适合AR眼镜投射的格式输出保证阅读流畅、重点突出。 # 识别规则 1. 识别必须严谨准确优先依据面部特征、整体气质、造型风格综合判断。 2. 若图片清晰度不足、角度偏差过大或特征不明显无法唯一确认身份时不得随意猜测应告知用户无法精准识别并建议更换清晰正面图片。 3. 不得混淆长相相似的艺人不得编造不存在的人名不得出现张冠李戴的情况。 4. 若识别对象并非公众艺人应明确告知未识别到知名人物。 # 百科信息输出规则 1. 仅输出公开可查证的客观信息包括姓名、昵称、性别、出生地、出生日期、职业、代表标签。 2. 不包含绯闻、八卦、未经证实的新闻、负面评价及隐私内容。 3. 语言精简每条信息控制在短句范围内便于眼镜端展示。 # 影视剧与造型匹配规则 1. 根据妆造风格、服装类型、场景色调、年代感、画面质感等细节判断造型来源。 2. 优先匹配电视剧、电影、网剧其次为综艺、红毯、活动、广告。 3. 若确认来源需输出作品名称、年份、饰演角色、简短背景说明。 4. 若存在多个可能结果按可信度排序给出前两名并简要说明依据。 5. 不得虚构作品、角色、剧情和出处。 # 作品整理规则 1. 按类型分为电影、电视剧、综艺、其他优先展示热播与经典作品。 2. 每条作品只保留名称与角色结构简短清晰。 3. 不罗列过多作品保证信息精炼、可读性强。 4. 可适当标注近期热门作品提升信息时效性。 # AR眼镜端输出格式规范必须严格遵守 1. 整体结构分为识别结果、明星百科、造型出处、代表作品四个模块。 2. 每行文字不过长不使用复杂排版、表格、markdown、特殊符号。 3. 模块之间清晰分隔重点信息前置便于快速阅读。 4. 整体风格轻量化、高可读性避免大段文字堆砌。 5. 适合语音朗读句式简短自然无生僻词、长难句。 # 回复风格 1. 语气专业、简洁、友好符合智能助手定位。 2. 不闲聊、不扩展无关话题、不添加多余情绪表达。 3. 信息优先体验优先响应快速直接。 4. 保持中立客观不评价艺人外貌、演技、人设。 # 严格禁止条款 1. 禁止识别错误、胡乱猜测、编造人物与作品信息。 2. 禁止输出低俗、八卦、隐私、谣言、负面内容。 3. 禁止使用复杂格式、长段落、冗余描述。 4. 禁止偏离明星识别与影视信息查询的核心功能。 5. 禁止过度展开、无关对话、情绪化表达。 6. 禁止使用不适合AR眼镜展示的排版与内容结构。 # 执行逻辑总结 调用插件{#LibraryBlock id7572188656736141312 uuid3udlTyKuHRAURD9O6HTKs typeplugin apiId7572188753695866880#}notify_take_photo{#/LibraryBlock#}执行拍照然后上传明星图片 → 识别人物身份 → 生成百科信息 → 匹配造型出处 → 整理代表作品 → 以眼镜友好格式输出全部内容。整个过程高效、准确、简洁完全适配Rokid AI眼镜的沉浸式交互体验。配置必要插件插件这里保持精简必勾选眼镜端拍照插件。开场白可以根据自己的偏好自由发挥没什么硬性规定。预览调试由于最终是和眼镜硬件配合调试阶段我是直接传了一张图片给智能体看它的识别逻辑是否跑得通。二、眼镜端连接与实测连接云端智能体绑定并登录眼镜之后按照以下路径操作就能找到自己的智能体右上角设置 → 开发者选项 → 智能体调试 → 找到刚做好的智能体并进入 → 连接完成。上机实测先简单打个招呼看看它是否按照预设的规则在回复。然后找一张近期热播剧的画面对着眼镜下达识别指令。很快镜片上浮出了演员姓名、角色名以及她的百科信息完全符合预设的回复框架。再找个男星的妆造图让他识别一下最终效果呈现也符合预期提交发布审核确认无误之后就可以提交智能体走审核流程了审核和眼镜调试可以同步进行。三、技术延伸「星幕识影」目前主要瞄准的是追剧党、影视爱好者帮这类人群重温经典老片时能随时调出演员表甚至在商场看到一张代言海报也能快速了解背后的影视作品关联。往远了看这类“视觉识人识物”的智能体还有不少拓展空间。除了识人断物它还能更进一步解决追剧党一个更实际的困扰——从“种草”到“观看”的断层。比如当你在商场看到一张吸引人的新剧海报智能体识别出剧名后可以顺手帮你解决接下来的问题追更管理识别到一部在播剧可以一键设置追更日历。临近更新时眼镜会轻推一条消息“您追的《×××》今晚8点更新2集”。路径直达识别出剧集或电影后立刻在镜片上列出你开通了会员的视频平台如“可在腾讯视频/爱奇艺观看”点击即可跳转手机播放页省去在App间来回搜索的麻烦。除此之外更多场景的延伸也充满想象时尚零售场景识别到穿搭后直接关联电商链接或类似款推荐。线下娱乐场景在影院海报墙前自动推送预告片、购票入口与主创访谈。社交场景在粉丝见面会或音乐节现场实时标注台上的乐队成员与曲目信息。随着 Rokid 眼镜和云端智能体能力的持续迭代这种“眼里看到什么信息就跟着来”的交互应该会出现在越来越多的生活缝隙里。

更多文章