Job Details

Jobs

jp2j2ywm5

Results Ready

Name

minilm_v2

Target Device

Creator

ai-hub-support@qti.qualcomm.com

Input Specs

input_ids: int32[1, 128]

attention_mask: int32[1, 128]

Completion Time

6/13/2026, 11:43:55 PM

Versions

Estimated Inference Time

1.23 ms

Estimated Peak Memory Usage

0 ‑ 93 MB

Compute Units

NPU

240

QNN Execution Provider	Value
htp_performance_mode	"burst"
htp_graph_finalization_optimization_mode	"3"
enable_htp_fp16_precision	"1"
capture_network_visualizations	false
context_priority	"normal"
offload_graph_io_quantization	"1"

Sign up to run this model on a hosted Qualcomm® device!

Profile Job Results