HarmonyOS鸿蒙Next中有没有语音转文字的Demo

HarmonyOS鸿蒙Next中有没有语音转文字的Demo 有没有语音转文字的Demo示例?

3 回复

可以参考 聊天页-语音转文字-关键场景示例-社交通讯类行业实践-场景化知识

代码下载:聊天页-语音转文字示例代码


如果你想给视频生成实时字幕,我在流心视频里测试了一下,效果如图,中文英文都能识别(需要api18以上)。

图片

import { AICaptionComponent, AICaptionOptions, AICaptionController } from '@kit.SpeechKit';
import { BusinessError } from '@kit.BasicServicesKit';
import { hilog } from '@kit.PerformanceAnalysisKit';

const TAG = 'AI_CAPTION_DEMO'

class Logger {
  static info(...msg: string[]) {
    hilog.info(0x0000, TAG, msg.join())
  }

  static error(...msg: string[]) {
    hilog.error(0x0000, TAG, msg.join())
  }
}

@Component
export struct AIAsr {
  private captionOption?: AICaptionOptions;
  private controller: AICaptionController = new AICaptionController();
  @State isShown: boolean = false;

  aboutToAppear(): void {
    // AI字幕初始化参数
    this.captionOption = {
      initialOpacity: 1,
      onPrepared: () => {
        Logger.info('AI字幕组件准备就绪')
      },
      onError: (error: BusinessError) => {
        Logger.error(`AI字幕组件错误。错误码: ${error.code}, 消息: ${error.message}`)
      }
    }
  }

  build() {
    Column({ space: 20 }) {
      Button('切换字幕显示状态:' + (this.isShown ? '显示' : '隐藏'))
        .backgroundColor('#B8BDA0')
        .width(200)
        .onClick(() => {
          this.isShown = !this.isShown;
        })

      Divider()

      // AI字幕组件 - 自动识别应用内音频
      AICaptionComponent({
        isShown: this.isShown,
        controller: this.controller,
        options: this.captionOption
      })
        .width('100%')
        .height(100)
    }
    .width('100%')
    .height('100%')
    .padding(10)
  }
}

更多关于HarmonyOS鸿蒙Next中有没有语音转文字的Demo的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html


HarmonyOS Next提供了语音转文本功能。通过@ohos.multimedia.audio@ohos.multimedia.speechToText模块实现。核心接口为SpeechToTextEngine,支持实时音频流识别和文件识别。需在module.json5中声明ohos.permission.MICROPHONE权限。示例代码展示初始化识别器、注册监听器及启动识别的流程。

目前HarmonyOS Next提供了语音识别服务(Speech Recognition Kit),支持实时语音转文字功能。开发者可通过以下方式获取示例:

  1. 访问华为开发者联盟官网
  2. 在HarmonyOS能力中心搜索"语音识别"
  3. 下载官方提供的语音识别示例代码

该Demo包含:

  • 语音实时识别实现
  • 音频文件转文字功能
  • 多语言识别支持(中文/英文等)
  • 识别结果回调处理

需要注意:

  • 需在真机设备上测试语音功能
  • 要申请相关权限配置
  • 当前仅支持部分设备型号

建议直接查阅最新版开发文档获取完整示例工程。

回到顶部