【openclaw实用Skill】openai-whisper-api 技能

张开发

• 2026/6/10 4:55:40 • 15 分钟阅读

分享文章

通过OpenAI音频转录API(Whisper)转录音频文件。使用curl脚本调用OpenAI的/v1/audio/transcriptions端点,支持多种参数配置和输出格式。技能概述openai-whisper-api 技能使用OpenAI的音频转录API将音频文件转换为文本。该技能通过curl脚本调用OpenAI的/v1/audio/transcriptions端点,提供了一个简单而强大的音频转录解决方案。支持多种音频格式,包括MP3、M4A、OGG等,并提供多种配置选项,如模型选择、语言指定、提示词设置等。输出可以是纯文本或JSON格式,满足不同的使用需求。下载地址:https://github.com/openclaw/openclaw/tree/main/skills主要功能音频转录: 将音频文件转录为文本多格式支持: 支持MP3、M4A、OGG等多种音频格式模型选择: 支持选择不同的Whisper模型语言指定: 可以指定音频的语言提示词支持: 可以提供提示词来改善转录质量多种输出格式: 支持文本和JSON输出触发条件在以下情况下应该调用此技能:用户需要使用OpenAI API转录音频用户需要高质量的音频转录用户需要指定音频语言或提供提示词用户需要JSON格式的转录结果使用场景场景1: 基本转录用户需要转录音频文件,使用默认设置进行转录。场景2: 指定语言用户知道音频的语言,指定语言以提高转录准确性。场景3: 使用提示词用户提供提示词(如说话人姓名)以改善转录质量。处理过程1. 基本转录使用默认设置转录音频文件:{baseDir}/scripts/transcribe.sh /path/to/audio.m4a2. 使用参数转录使用自定义参数转录音频:{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --model whisper-1 --out /tmp/transcript.txt {baseDir}/scripts/transcribe.sh /path/to/audio.m4a --language en {baseDir}/scripts/transcribe.sh /path/to/audio.m4a --prompt Speaker names: Peter, Daniel {baseDir}/scripts/transcribe.sh /path/to/audio.m4a --json --out /tmp/transcript.json输入要求使用此技能时,用户需要提供:音频文件路径: 要转录的音频文件模型(可选): 要使用的Whisper模型语言(可选): 音频的语言提示词(可选): 改善转录质量的提示词输出格式(可选): 文本或JSON格式输出说明技能将提供:转录文本: 音频的文本转录JSON数据(可选): 结构化的转录数据使用示例示例: 转录音频文件并输出为JSON格式{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --json --out /tmp/transcript.json最佳实践指定语言: 如果知道音频语言,指定语言以提高准确性使用提示词: 提供提示词(如说话人姓名、专业术语)以改善转录质量选择输出格式: 根据需求选择文本或JSON输出指定输出路径: 使用--out参数指定输出文件路径配置API密钥: 确保OPENAI_API_KEY已正确配置默认设置模型: whisper-1输出: .txtAPI密钥配置环境变量: 设置OPENAI_API_KEY环境变量配置文件: 在~/.openclaw/openclaw.json中配置配置文件示例{ skills: { openai-whisper-api: { apiKey: OPENAI_KEY_HERE, }, }, }

更多文章

前端开发 2026/6/10 2:13:51

COMET：神经网络驱动的翻译质量评估解决方案

COMET：神经网络驱动的翻译质量评估解决方案【免费下载链接】COMET A Neural Framework for MT Evaluation 项目地址: https://gitcode.com/gh_mirrors/com/COMET 一、翻译评估的效率困境与技术破局在全球化内容生产的浪潮中，翻译质量评估成为…

张开发

前端开发 2026/6/9 19:50:52

华硕笔记本终极性能优化工具：GHelper完整使用指南

华硕笔记本终极性能优化工具：GHelper完整使用指南【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar, …

张开发

前端开发 2026/5/16 10:55:00

BERT大模型入门：小白也能学会的预训练+微调范式！收藏学习必备

BERT作为NLP领域的里程碑，首次将双向Transformer表示学习与大规模无监督预训练结合，显著提升了NLP任务效果，推动大模型时代到来。本文核心介绍了BERT的双向上下文信息学习、Transformer Encoder架构、MLM和NSP预训练任务，以及“预…

张开发

前端开发 2026/6/9 23:05:18

如何用AccelStepper库实现Arduino步进电机精确控制：从基础到高级的5个实战技巧

如何用AccelStepper库实现Arduino步进电机精确控制：从基础到高级的5个实战技巧【免费下载链接】AccelStepper Fork of AccelStepper 项目地址: https://gitcode.com/gh_mirrors/acc/AccelStepper 在Arduino项目中控制步进电机时，你是否遇到过速度…

张开发

前端开发 2026/6/10 0:04:47

Mermaid×Confluence：企业级知识库可视化管理的全栈解决方案

MermaidConfluence：企业级知识库可视化管理的全栈解决方案【免费下载链接】mermaid Generation of diagrams like flowcharts or sequence diagrams from text in a similar manner as markdown 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid …

张开发

前端开发 2026/6/10 1:17:58

喜马拉雅音频下载器：如何用开源工具永久保存你的付费内容？

喜马拉雅音频下载器：如何用开源工具永久保存你的付费内容？ 【免费下载链接】xmly-downloader-qt5 喜马拉雅FM专辑下载器. 支持VIP与付费专辑. 使用GoQt5编写(Not Qt Binding). 项目地址: https://gitcode.com/gh_mirrors/xm/xmly-downloader-qt5 …

张开发

前端开发 2026/6/9 23:24:40

3大引擎驱动：COMET如何重构翻译质量评估体系

3大引擎驱动：COMET如何重构翻译质量评估体系【免费下载链接】COMET A Neural Framework for MT Evaluation 项目地址: https://gitcode.com/gh_mirrors/com/COMET 在全球化内容生产的浪潮中，翻译质量评估正面临前所未有的挑战。企业级翻译场景需…

张开发

前端开发 2026/5/16 10:58:59

原子化失业期PHP程序员，别轻易放弃。但方向真错了，也别硬撑，及时掉头不丢人。

这句话是失业期 PHP 程序员在“坚持”与“止损”之间寻找动态平衡的战略智慧。它的本质是：区分“战术上的困难”与“战略上的错误”。对于前者，需要韧性（Grit）去克服；对于后者，需要勇气（Courag…

张开发

前端开发 2026/6/9 22:11:49

订单号重复、时间戳漂移、幂等键失效——PHP电商系统上线前最后48小时必须完成的5项终极冒烟测试

第一章：订单号重复、时间戳漂移、幂等键失效——PHP电商系统上线前最后48小时必须完成的5项终极冒烟测试在高并发电商场景下，订单号生成冲突、NTP时间不同步导致的时间戳倒退、以及Redis幂等键因TTL误设或key拼接逻辑缺陷而失效，是压垮系统稳…

张开发

前端开发 2026/6/10 0:49:06

实习06-Pretrain数据处理

Pretrain 数据怎么挑选按照2022 年 9 月，DeepMind（Chinchilla 论文）中提出 Hoffman scaling laws：表明每个参数需要大约 20 个文本token进行训练。本次训练的参数量10B，其实里面5B线性模型真正训练。计划使用10B20=200B token=2001.5=300G个中文字符=1200G数据。200B/6.…

张开发

前端开发 2026/6/9 5:53:47

建筑行业企业大数据可视化大屏系统源码（Vue3+DataV架构）

温馨提示：文末有联系方式核心技术架构：Vue3 DataV 响应式可视化引擎采用前沿 Vue3 组合式 API 构建，深度集成 DataV 可视化组件库，实现毫秒级渲染与自适应布局能力，完美兼容1080P、超宽屏（32:9&#xff…

张开发

前端开发 2026/5/16 10:55:07

系统轻量化：Win11Debloat优化工具深度应用指南

系统轻量化：Win11Debloat优化工具深度应用指南【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and customize…

张开发

【openclaw实用Skill】openai-whisper-api 技能

最新文章

如何轻松批量下载视频号内容：res-downloader完整指南

高通Camera HAL3实战：从configure_streams到Usecase创建，一次搞懂ZSL拍照背后的完整流程

从天气预报到视频预测：ConvLSTM实战项目入门（附PyTorch完整代码）

别再乱卸载补丁了！Win10共享打印机0x00000709/11b错误，用这个官方修复补丁KB5007253一键搞定

别再只会下载程序了！手把手教你用J-Link的J-Scope和RTT功能做实时数据可视化

mysql如何使用INNER JOIN内连接_mysql等值连接实现方式

推荐文章

相关文章

分享文章

更多文章

COMET：神经网络驱动的翻译质量评估解决方案

华硕笔记本终极性能优化工具：GHelper完整使用指南

BERT大模型入门：小白也能学会的预训练+微调范式！收藏学习必备

如何用AccelStepper库实现Arduino步进电机精确控制：从基础到高级的5个实战技巧

Mermaid×Confluence：企业级知识库可视化管理的全栈解决方案

喜马拉雅音频下载器：如何用开源工具永久保存你的付费内容？

3大引擎驱动：COMET如何重构翻译质量评估体系

原子化失业期PHP程序员，别轻易放弃。但方向真错了，也别硬撑，及时掉头不丢人。

订单号重复、时间戳漂移、幂等键失效——PHP电商系统上线前最后48小时必须完成的5项终极冒烟测试

实习06-Pretrain数据处理

建筑行业企业大数据可视化大屏系统源码（Vue3+DataV架构）

系统轻量化：Win11Debloat优化工具深度应用指南