Job Details

Jobs

j56vk4o0p

Results Ready

Name

minilm_v2

Target Device

Creator

ai-hub-support@qti.qualcomm.com

Input Specs

input_ids: int32[1, 128]

attention_mask: int32[1, 128]

Completion Time

6/13/2026, 11:48:54 PM

Versions

Estimated Inference Time

2.37 ms

Estimated Peak Memory Usage

0 ‑ 3 MB

Compute Units

NPU

319

Lite RT	Value
number_of_threads	4

QNN Delegate	Value
backend_type	kHtpBackend
log_level	kLogLevelWarn
htp_options.performance_mode	kHtpBurst
htp_options.precision	kHtpFp16
htp_options.optimization_strategy	kHtpOptimizeForInferenceO3
htp_options.useConvHmx	true

Sign up to run this model on a hosted Qualcomm® device!

Profile Job Results