HarmonyOS鸿蒙Next中小艺开放平台现在是不是还没有图片处理的大模型

HarmonyOS鸿蒙Next中小艺开放平台现在是不是还没有图片处理的大模型 【问题描述】:想搭建一个包含图片处理功能的工作流,问一下有没有支持图片处理的大模型

【问题现象】:不涉及

【版本信息】:不涉及

【复现代码】:不涉及

【尝试解决方案】:不涉及

7 回复

尊敬的开发者,您好!请问您是在什么样的业务场景中使用该能力,交互流程是怎样的,在哪一个环节遇到了问题?方便说明能力不满足可能带来的影响:什么时间用到?是否高频?有无三方库可以做到?若提供该能力,是否会造成大工作量返工?请您注意提供的内容不要包含您或第三方的非公开信息,如给您带来不便,敬请谅解。

更多关于HarmonyOS鸿蒙Next中小艺开放平台现在是不是还没有图片处理的大模型的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html


现在想开发一个包含图片处理功能的工作流,在图片处理时想调用大模型进行处理,想问一下有没有支持图片处理的大模型,

有要学HarmonyOS AI的同学吗,联系我:https://www.itying.com/goods-1206.html

尊敬的开发者,您好!

目前有两个图片处理的插件:

“个人证件照识别” 属于MCP插件,能满足形成结构化数据的要求,目前已对企业开发者开放,即将对个人开发者开放。

OCR插件 属于云插件,个人开发者目前可以使用,可以实现识别图片中的文本,但是不能满足形成结构化数据的要求。

您看看这两个插件能否满足您的业务需求?

我这边是想要实现一个照片涂鸦的功能,有没有什么较好的解决方法,

目前HarmonyOS鸿蒙Next的小艺开放平台尚未提供专门的图片处理大模型功能。平台当前主要聚焦于语音交互、语义理解等核心AI能力,图像处理相关的高级模型(如图像生成、编辑等)暂未开放。开发者如需图像处理能力,建议关注华为官方后续的更新公告。

目前,HarmonyOS Next 的小艺开放平台(YOYO AI Kit)主要聚焦于语音交互、自然语言处理、设备控制等核心场景,其内置的AI能力以端侧大模型和语音助手功能为主。

关于图片处理的大模型,截至当前最新的公开信息,小艺开放平台尚未正式提供专门的、面向第三方开发者的图片生成或复杂图像处理的大模型服务(例如类似文生图、图生图、图像风格迁移等)。平台现有的AI能力更侧重于对已有图片的识别、理解与分析(例如图像标签、场景识别、OCR文字识别等),而非生成或深度编辑。

如果您需要构建包含图片生成或高级处理功能的工作流,建议关注以下替代或未来方案:

  1. 利用现有AI能力组合:可以结合小艺开放平台提供的图像识别、分割等能力,与其他计算模块组合,实现部分处理流程。
  2. 关注官方更新:华为的AI能力在持续演进,建议通过华为开发者联盟官网、HarmonyOS开发者文档等官方渠道,密切关注小艺开放平台的能力更新公告,看未来是否会集成或开放相关的图像生成大模型。
  3. 评估混合架构:对于当前急需的功能,可以考虑在HarmonyOS应用中集成第三方云服务或本地部署的图片AI模型,作为工作流的一部分,但这需要自行处理模型集成、数据合规与性能调优。

总结来说,目前小艺开放平台直接提供的、可调用的图片处理大模型能力有限,构建复杂图片生成工作流可能需要结合平台外方案或等待平台后续的能力扩展。

回到顶部