HarmonyOS 鸿蒙Next中使用软键盘自带的表情，当表情被截断了，会出现乱码

你在鸿蒙 6 中使用富文本组件实现展开 / 更多功能时，表情被截断出现乱码，核心原因是：Emoji 表情是多字节的 Unicode 字符（如😀对应 U+1F600），若按字符长度 / 字节数粗暴截断，会拆分表情的完整 Unicode 编码，导致富文本组件解析不完整编码时显示乱码；解决关键是先识别表情字符，再保证截断时不拆分表情。

解决方案（可直接复用）

1. 工具函数：判断字符 / 文本是否包含表情（识别 Emoji Unicode 范围）

Emoji 有固定的 Unicode 编码范围，通过正则匹配这些范围，即可判断字符是否为表情：

/**
 * 工具函数：判断单个字符是否为Emoji表情
 * @param char 单个字符
 * @returns 是否为表情
 */
export function isEmojiChar(char: string): boolean {
  if (char.length !== 1) return false;
  // Emoji的核心Unicode编码范围（覆盖主流软键盘表情）
  const emojiRegex = /[\u{1F600}-\u{1F64F}\u{1F300}-\u{1F5FF}\u{1F680}-\u{1F6FF}\u{1F1E0}-\u{1F1FF}\u{2600}-\u{26FF}\u{2700}-\u{27BF}\u{1F900}-\u{1F9FF}]/u;
  return emojiRegex.test(char);
}

/**
 * 工具函数：判断文本中指定位置是否处于表情字符内（避免截断表情）
 * @param text 原文本
 * @param index 截断位置索引
 * @returns 是否在表情字符内
 */
export function isInEmojiRange(text: string, index: number): boolean {
  if (index >= text.length) return false;
  // 从截断位置往前/后检查1-2个字符（Emoji多为1-2个Unicode码点）
  for (let i = Math.max(0, index - 2); i <= Math.min(text.length - 1, index + 2); i++) {
    if (isEmojiChar(text[i])) {
      // 若截断位置落在表情字符区间内，返回true
      return i <= index && index < i + 1;
    }
  }
  return false;
}

2. 安全截断文本：避免拆分表情字符

在富文本 “展开 / 更多” 的截断逻辑中，调用上述工具函数，确保截断位置不拆分表情：

/**
 * 安全截断文本（保留完整表情，避免乱码）
 * @param text 原文本
 * @param maxLength 目标截断长度
 * @returns 截断后的文本
 */
export function safeTruncateText(text: string, maxLength: number): string {
  if (text.length <= maxLength) return text;
  
  let truncateIndex = maxLength;
  // 若截断位置落在表情内，往前找第一个非表情位置
  while (truncateIndex > 0 && isInEmojiRange(text, truncateIndex)) {
    truncateIndex--;
  }
  
  // 若截断后末尾是表情，直接保留完整表情（长度略超也可，避免乱码）
  if (isEmojiChar(text[truncateIndex])) {
    truncateIndex++;
  }
  
  return text.substring(0, truncateIndex);
}

3. 富文本组件集成（展开 / 更多功能）

将安全截断逻辑融入富文本的展开 / 折叠逻辑，示例：

@Entry
@Component
struct RichTextWithEmoji {
  @State fullText: string = '这是带表情的文本😀😜，末尾表情避免截断乱码';
  @State isExpand: boolean = false;
  private maxTruncateLength = 10; // 截断长度

  // 获取截断后的文本
  get displayText(): string {
    if (this.isExpand) return this.fullText;
    // 调用安全截断函数，避免表情拆分
    const truncated = safeTruncateText(this.fullText, this.maxTruncateLength);
    return truncated + (this.fullText.length > truncated.length ? '... 更多' : '');
  }

  build() {
    Column() {
      // 富文本组件渲染安全截断后的文本
      RichText(this.displayText)
        .onClick(() => {
          this.isExpand = !this.isExpand; // 切换展开/折叠
        })
        .width('100%')
        .padding(10);
    }
  }
}

关键优化点

表情识别范围：上述正则覆盖了主流软键盘表情（笑脸、图标、符号等），若需支持更多表情，可补充 Emoji 的 Unicode 扩展范围；
截断容错：若截断位置刚好在表情开头，优先往前截断（舍弃该表情），而非拆分；若需保留表情，可适当放宽截断长度（如 maxLength+1）；
富文本渲染：鸿蒙富文本组件对 Emoji 的渲染依赖完整编码，确保传入的文本无拆分的 Emoji 编码即可避免乱码。

总结

核心：表情是多字节 Unicode 字符，截断时需保证编码完整，不可拆分；
关键步骤：① 用 Unicode 正则识别表情；② 截断时跳过表情字符区间；③ 富文本渲染安全截断后的文本；
避坑：不要直接按字节数（如 UTF-8 的 3/4 字节）截断，需按 Unicode 字符数 + 表情校验截断。

更多关于HarmonyOS 鸿蒙Next中使用软键盘自带的表情，当表情被截断了，会出现乱码的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html

htzhanglong 2楼

楼主方便提供一下出现这种情况的文字吗，最好提供一部分代码来进行分析

wuwangju 3楼

找HarmonyOS工作还需要会Flutter的哦，有需要Flutter教程的可以学学大地老师的教程，很不错，B站免费学的哦：https://www.bilibili.com/video/BV1S4411E7LY/?p=17

caililin 4楼

@Entry
@Component
struct Page {
  @State testString: string = '测试文本测试文本😂😂😂😂😂😂';

  build() {
    Column() {
      Text(this.testString)
      Button("删除末尾")
        .onClick(()=>{
          if (this.testString.length > 0) {
              this.testString = this.testString.substring(0, this.testString.length - 1);
          }
        })
    }.width('100%').margin({ top: 5 })
  }
}

测试demo 展开收起功能也是通过substring方法实现，

songsunli 5楼

在HarmonyOS Next中，软键盘表情截断导致乱码，通常与文本渲染或编码处理有关。可能涉及系统UI组件对Unicode表情符号的显示支持不足，或文本控件未正确适配多码点表情。需检查相关组件的文本截断和绘制逻辑，确保对复杂Unicode序列（如表情符号）的完整处理。

yibo5220 6楼

在HarmonyOS Next中处理富文本组件内表情被截断导致乱码的问题，可以从以下几个方面着手解决：

核心原因：乱码通常是由于表情符号（尤其是Unicode表情或emoji序列）在文本截断时被从中间分割，导致编码不完整。富文本组件在计算“可见区域”和进行截断时，可能基于字符数或字节数，而未识别表情是一个完整的语义单元。
判断表情的方法：
- Unicode范围检测：大部分常用表情在Unicode中有明确的码点范围（如U+1F600-U+1F64F等）。可以通过检查字符的Unicode码点是否落在这些范围内进行初步判断。
- 使用正则表达式：HarmonyOS Next的ArkTS/TS支持正则表达式，可以编写匹配常见表情模式的正则进行识别。但需要注意，一些复杂表情（如序列：表情+修饰符）需要更精确的模式。
- 第三方库：考虑使用经过验证的、轻量的JavaScript/TypeScript表情处理库（需确保兼容ArkTS），它们通常有更完整的表情检测逻辑。
解决截断问题的思路：
- 截断前预处理：在计算截断位置前，先对文本进行扫描。当截断点落在被识别为表情的字符序列内时，将截断点向前调整至该表情的起始位置（即避免分割表情）。
- 富文本组件定制：如果使用的是自定义富文本组件，可以在布局和渲染阶段，将表情视为一个不可分割的整体（类似一个内联图片）。在计算文本溢出和截断时，将其作为一个整体单元处理。
- 备用方案：如果表情被截断的风险较高，可以考虑在截断处（如“查看更多”之前）不显示最后一个不完整的表情，或用占位符（如“…”）替代，确保编码完整性。
实施建议：
- 在实现“展开/收起”功能时，优先采用基于布局渲染后实际高度的截断判断，而非纯文本字符截断。通过获取富文本容器的实际内容高度与显示高度进行比较，来决定是否截断。这能更自然地避免分割任何视觉元素（包括表情）。
- 如果必须进行文本层级的截断，务必先对文本进行表情边界解析，确保在安全的边界点（如表情之间、字符之间）进行分割。

通过将表情视为一个独立的逻辑单元并在截断逻辑中予以保护，可以有效避免因编码分割导致的乱码问题。