HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码
HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码
介绍
本示例介绍如何使用speechRecognizer实时语言转文字,并且根据光标位置插入文字,以及文本一键清空功能。
实现实时语音转文字功能源码链接
效果预览
使用说明
- 点击顶部按钮可切换本人或非本人模拟聊天界面发送消息,本人发送右对齐,非本人发送左对齐。
- 点击RichEditor组件唤起输入法,已发送的消息自动避让。
- 长按启动实时语音转文字,松开停止语音转文字,根据光标所在位置插入语音识别的文字,点击清空可以清除RichEditor组件中的内容。
- 点击发送可以将RichEditor组件中的内容发送出去,可发送文字和图片消息。
实现思路
聊天页面左右布局
通过Flex组件实现左右布局,本人发送时设置方向为FlexDirection.RowReverse,非本人发送时设置方向为FlexDirection.Row。
图文混排消息显示
整体使用Text去布局,文字通过内嵌Span组件显示,图片显示通过内嵌ImageSpan组件显示。
实现已发送的消息自动避让
首先在aboutToAppear中设置键盘模式为上抬模式。
实时语音转文字
-
语音转文字需使用麦克风权限,需要在module.json5文件中申明麦克风权限,使用时去请求麦克风权限。
-
调用系统speechRecognizerAPI进行实时语音识别。
根据光标位置插入语音识别的文字
通过getCaretOffset获取到光标所在位置。在插入文字时设置对应的偏移量来达成目的,RichEditor输入框无内容时增加正在识别…文字提示,有内容时增加…内容提示。
更多关于HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html
在HarmonyOS鸿蒙Next中实现实时语音转文字功能,可以使用AudioCapturer
进行音频采集,并通过SpeechRecognitionService
进行语音识别。以下是一个简单的示例代码:
import audio from '@ohos.multimedia.audio';
import speech from '@ohos.speech';
// 创建音频采集器
let audioCapturer = audio.createAudioCapturer({
audioCapturerOptions: {
streamUsage: audio.StreamUsage.STREAM_USAGE_VOICE_COMMUNICATION,
sampleRate: audio.AudioSamplingRate.SAMPLE_RATE_16K,
channels: audio.AudioChannel.CHANNEL_OUT_MONO,
audioSampleFormat: audio.AudioSampleFormat.SAMPLE_FORMAT_S16LE,
bufferSizeInBytes: 4096
}
});
// 创建语音识别服务
let speechRecognition = speech.createSpeechRecognitionService();
// 启动音频采集
audioCapturer.start().then(() => {
console.log("AudioCapturer started");
});
// 设置语音识别回调
speechRecognition.on('result', (result) => {
console.log("Recognized text: " + result.text);
});
// 开始语音识别
speechRecognition.start().then(() => {
console.log("SpeechRecognition started");
});
// 从音频采集器读取数据并发送给语音识别服务
let buffer = new ArrayBuffer(4096);
audioCapturer.read(buffer).then((readResult) => {
if (readResult > 0) {
speechRecognition.write(buffer);
}
});
// 停止音频采集和语音识别
audioCapturer.stop().then(() => {
console.log("AudioCapturer stopped");
});
speechRecognition.stop().then(() => {
console.log("SpeechRecognition stopped");
});
此代码展示了如何在HarmonyOS鸿蒙Next中实现实时语音转文字功能。AudioCapturer
用于采集音频数据,SpeechRecognitionService
用于将语音转换为文字。通过事件监听和异步操作,实现了音频采集和语音识别的无缝集成。
更多关于HarmonyOS鸿蒙Next中实现实时语音转文字功能示例代码的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html
在HarmonyOS鸿蒙Next中,可以通过@ohos.multimedia.audio
和@ohos.ai.speech
模块实现实时语音转文字功能。以下是一个简单的示例代码:
import audio from '@ohos.multimedia.audio';
import { SpeechRecognizer } from '@ohos.ai.speech';
// 创建音频采集器
let audioCapturer = audio.createAudioCapturer({
audioFormat: audio.AudioFormat.AUDIO_DEFAULT,
audioSampleRate: audio.AudioSampleRate.SAMPLE_RATE_16000,
audioChannels: audio.AudioChannel.CHANNEL_1,
audioSourceType: audio.AudioSourceType.AUDIO_SOURCE_TYPE_MIC
});
// 创建语音识别器
let speechRecognizer = new SpeechRecognizer();
// 开始录音并识别
audioCapturer.start((err) => {
if (err) {
console.error('Failed to start audio capture.');
return;
}
speechRecognizer.startListening((result) => {
console.log('Recognized text:', result.text);
});
});
// 停止录音
audioCapturer.stop();
这段代码首先创建了一个音频采集器,然后使用语音识别器进行实时语音转文字。请确保在config.json
中添加相关权限声明。