HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码

发布于 1周前 作者 bupafengyu 来自 鸿蒙OS

HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码

介绍

本示例介绍如何使用speechRecognizer实时语言转文字,并且根据光标位置插入文字,以及文本一键清空功能。

实现实时语音转文字功能源码链接

效果预览

图片名称

使用说明

  1. 点击顶部按钮可切换本人或非本人模拟聊天界面发送消息,本人发送右对齐,非本人发送左对齐。
  2. 点击RichEditor组件唤起输入法,已发送的消息自动避让。
  3. 长按启动实时语音转文字,松开停止语音转文字,根据光标所在位置插入语音识别的文字,点击清空可以清除RichEditor组件中的内容。
  4. 点击发送可以将RichEditor组件中的内容发送出去,可发送文字和图片消息。

实现思路

聊天页面左右布局

通过Flex组件实现左右布局,本人发送时设置方向为FlexDirection.RowReverse,非本人发送时设置方向为FlexDirection.Row。

图文混排消息显示

整体使用Text去布局,文字通过内嵌Span组件显示,图片显示通过内嵌ImageSpan组件显示。

实现已发送的消息自动避让

首先在aboutToAppear中设置键盘模式为上抬模式。

实时语音转文字

  1. 语音转文字需使用麦克风权限,需要在module.json5文件中申明麦克风权限,使用时去请求麦克风权限。

  2. 调用系统speechRecognizerAPI进行实时语音识别。

根据光标位置插入语音识别的文字

通过getCaretOffset获取到光标所在位置。在插入文字时设置对应的偏移量来达成目的,RichEditor输入框无内容时增加正在识别…文字提示,有内容时增加…内容提示。


更多关于HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html

2 回复

在HarmonyOS鸿蒙Next中实现实时语音转文字功能,可以使用AudioCapturer进行音频采集,并通过SpeechRecognitionService进行语音识别。以下是一个简单的示例代码:

import audio from '@ohos.multimedia.audio';
import speech from '@ohos.speech';

// 创建音频采集器
let audioCapturer = audio.createAudioCapturer({
    audioCapturerOptions: {
        streamUsage: audio.StreamUsage.STREAM_USAGE_VOICE_COMMUNICATION,
        sampleRate: audio.AudioSamplingRate.SAMPLE_RATE_16K,
        channels: audio.AudioChannel.CHANNEL_OUT_MONO,
        audioSampleFormat: audio.AudioSampleFormat.SAMPLE_FORMAT_S16LE,
        bufferSizeInBytes: 4096
    }
});

// 创建语音识别服务
let speechRecognition = speech.createSpeechRecognitionService();

// 启动音频采集
audioCapturer.start().then(() => {
    console.log("AudioCapturer started");
});

// 设置语音识别回调
speechRecognition.on('result', (result) => {
    console.log("Recognized text: " + result.text);
});

// 开始语音识别
speechRecognition.start().then(() => {
    console.log("SpeechRecognition started");
});

// 从音频采集器读取数据并发送给语音识别服务
let buffer = new ArrayBuffer(4096);
audioCapturer.read(buffer).then((readResult) => {
    if (readResult > 0) {
        speechRecognition.write(buffer);
    }
});

// 停止音频采集和语音识别
audioCapturer.stop().then(() => {
    console.log("AudioCapturer stopped");
});

speechRecognition.stop().then(() => {
    console.log("SpeechRecognition stopped");
});

此代码展示了如何在HarmonyOS鸿蒙Next中实现实时语音转文字功能。AudioCapturer用于采集音频数据,SpeechRecognitionService用于将语音转换为文字。通过事件监听和异步操作,实现了音频采集和语音识别的无缝集成。

更多关于HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html


在HarmonyOS鸿蒙Next中,可以通过@ohos.multimedia.audio@ohos.ai.speech模块实现实时语音转文字功能。以下是一个简单的示例代码:

import audio from '@ohos.multimedia.audio';
import { SpeechRecognizer } from '@ohos.ai.speech';

// 创建音频采集器
let audioCapturer = audio.createAudioCapturer({
  audioFormat: audio.AudioFormat.AUDIO_DEFAULT,
  audioSampleRate: audio.AudioSampleRate.SAMPLE_RATE_16000,
  audioChannels: audio.AudioChannel.CHANNEL_1,
  audioSourceType: audio.AudioSourceType.AUDIO_SOURCE_TYPE_MIC
});

// 创建语音识别器
let speechRecognizer = new SpeechRecognizer();

// 开始录音并识别
audioCapturer.start((err) => {
  if (err) {
    console.error('Failed to start audio capture.');
    return;
  }
  speechRecognizer.startListening((result) => {
    console.log('Recognized text:', result.text);
  });
});

// 停止录音
audioCapturer.stop();

这段代码首先创建了一个音频采集器,然后使用语音识别器进行实时语音转文字。请确保在config.json中添加相关权限声明。

回到顶部
AI 助手
你好,我是IT营的 AI 助手
您可以尝试点击下方的快捷入口开启体验!