HarmonyOS 鸿蒙Next请问个人开发app能内嵌本地大模型吗?如qwen3.5-3b
HarmonyOS 鸿蒙Next请问个人开发app能内嵌本地大模型吗?如qwen3.5-3b 自己开发了一款app需要内嵌本地模型,如果不能,只能放弃华为了,转战安卓系统。
6 回复
可参考如下两种开发方式:
- 方式一:使用MindSpore Lite ArkTS API开发AI应用。开发者直接在UI代码中调用 MindSpore Lite ArkTS API 加载模型并进行AI模型推理,此方式可快速验证效果。
- 方式二:使用MindSpore Lite Native API开发AI应用。开发者将算法模型和调用 MindSpore Lite Native API 的代码封装成动态库,并通过N-API封装成ArkTS接口,供UI调用。
更多关于HarmonyOS 鸿蒙Next请问个人开发app能内嵌本地大模型吗?如qwen3.5-3b的实战系列教程也可以访问 https://www.itying.com/category-93-b0.html
个人感觉,在大模型这块,鸿蒙系统还是有点落后的,赶在这个点,实在是没办法,要么开源,要么加大力度研!发,但是一个公司追一个行业有点太难了;希望it界的大佬多用鸿蒙开发,
可以内嵌 不过3b太大 可以用0.5b 使用 阿里的mnn框架 或者 使用onnx,
应该是可以,但是要相关资质
在 HarmonyOS 鸿蒙Next 中,个人开发者可以在 App 内内嵌本地大模型(如 Qwen),完全可以做到。
技术上通常采用 C++ 推理框架(如 MNN、NCNN、llama.cpp)直接运行转换后的模型。将模型量化为 int4/int8 格式,减小体积与内存占用,然后通过 N-API 暴露给 ArkTS 层调用。代码示例(核心集成思路):
// 初始化推理引擎
auto net = MNN::Interpreter::createFromFile(modelPath.c_str());
MNN::ScheduleConfig config;
config.type = MNN_FORWARD_NPU; // 优先使用NPU加速
auto session = net->createSession(config);
// 输入输出张量绑定量
auto input = net->getSessionInput(session, nullptr);
std::memcpy(input->host<void>(), inputData, inputSize);
net->runSession(session);
auto output = net->getSessionOutput(session, nullptr);
// 从 output 读取推理结果
此外也可使用 MindSpore Lite for OHOS 或 HiAI Foundation,直接将模型转换为 .ms 格式调用 NPU。注意处理模型沙箱路径和内存限制,3B 模型量化后可在主流设备上实时运行。无需转战安卓。


