HarmonyOS 鸿蒙Next中音频转文字现在仍然只支持60s以内的音频文件吗?

HarmonyOS 鸿蒙Next中音频转文字现在仍然只支持60s以内的音频文件吗? 如题,这个功能60s以上的音频开放了没有

3 回复

Core Speech Kit(基础语音服务)集成了语音类基础AI能力,包括文本转语音(TextToSpeech)及语音识别(SpeechRecognizer)能力,便于用户与设备进行互动,实现将实时输入的语音与文本之间相互转换。

  • 文本转语音:将一段不超过10000字数的文本合成为语音并进行播报。
  • 语音识别:将一段音频信息(短语音模式不超过60s,长语音模式不超过8h)转换为文本,可以将pcm音频文件或者实时语音转换为文字。
AI能力 约束
语音识别 - 支持的语种类型:中文普通话。
- 支持的模型类型:离线。
- 语音时长:短语音模式不超过60s,长语音模式不超过8h。

更多关于HarmonyOS 鸿蒙Next中音频转文字现在仍然只支持60s以内的音频文件吗?的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html


目前HarmonyOS Next的音频转文字功能仍限制在60秒以内。该限制由系统音频处理模块的缓冲区设计决定,主要基于实时性和资源管理的考虑。后续版本是否会扩展时长取决于系统架构优化进度。当前建议通过分段处理实现长音频转换。

截至目前,HarmonyOS Next 的音频转文字功能仍主要针对 60 秒以内的短音频文件进行优化,暂未官方宣布支持更长音频的转换。建议关注 HarmonyOS 官方文档或后续版本更新,以获取功能扩展信息。

回到顶部