| Name | Module | Coverage (%) | Inclusive Time w.r.t. Wall Time(s) | Max Inc. Time over Threads(s) | Nb Threads | GFLOP/s | Deviation (coverage) | Deviation (time) |
| orig_default | aocc_default | icx_2 | aocc_6 | orig_default | aocc_default | icx_2 | aocc_6 | orig_default | aocc_default | icx_2 | aocc_6 | orig_default | aocc_default | icx_2 | aocc_6 | orig_default | aocc_default | icx_2 | aocc_6 | orig_default | aocc_default | icx_2 | aocc_6 | orig_default | aocc_default | icx_2 | aocc_6 |
| kmp_flag_64<false, true>::wait(kmp_info*, int, void*) | libiomp5.so | 54.14 | NA | 54.71 | NA | 2.91 | NA | 2.92 | NA | 4.97 | NA | 4.99 | NA | 96 | NA | 96 | NA | 0.00 | NA | 0.00 | NA | 14.55 | NA | 14.57 | NA | 0.75 | NA | 0.75 | NA |
| __kmp_hyper_barrier_release(barrier_type, kmp_info*, int, int, int, void*) | libomp.so | NA | 45.26 | NA | 44.83 | NA | 2.27 | NA | 2.23 | NA | 3.99 | NA | 4.03 | NA | 96 | NA | 96 | NA | 0.00 | NA | 0.00 | NA | 14.05 | NA | 13.86 | NA | 0.70 | NA | 0.68 |
| ggml_backend_amx_mul_mat(ggml_compute_params const*, ggml_tensor*)::$_2::operator()(int, int) const::{lambda()#1}::operator()() const | libggml-cpu.so | NA | 39.15 | NA | 39.65 | NA | 1.97 | NA | 1.97 | NA | 2.78 | NA | 2.73 | NA | 96 | NA | 96 | NA | 372.02 | NA | 369.74 | NA | 15.37 | NA | 15.31 | NA | 0.77 | NA | 0.76 |
| ggml_backend_amx_mul_mat(ggml_compute_params const*, ggml_tensor*)::{lambda(int, int)#3}::operator()(int, int) const::{lambda()#1}::operator()() const | libggml-cpu.so | 39.07 | NA | 39.08 | NA | 2.10 | NA | 2.09 | NA | 2.81 | NA | 2.83 | NA | 96 | NA | 96 | NA | 348.49 | NA | 350.25 | NA | 13.97 | NA | 13.84 | NA | 0.75 | NA | 0.74 | NA |
| __kmp_hardware_timestamp | libomp.so | NA | 10.21 | NA | 10.23 | NA | 0.51 | NA | 0.51 | NA | 0.95 | NA | 0.94 | NA | 96 | NA | 96 | NA | 0.00 | NA | 0.00 | NA | 2.91 | NA | 3.12 | NA | 0.14 | NA | 0.15 |
| kmp_flag_native<unsigned long long, (flag_type)1, true>::notdone_check() | libiomp5.so | 1.72 | NA | 1.56 | NA | 0.09 | NA | 0.08 | NA | 0.19 | NA | 0.18 | NA | 96 | NA | 96 | NA | 0.00 | NA | 0.00 | NA | 0.65 | NA | 0.51 | NA | 0.03 | NA | 0.03 | NA |
| __kmp_hyper_barrier_gather(barrier_type, kmp_info*, int, int, void (*)(void*, void*), void*) | libomp.so | NA | 1.48 | NA | 1.57 | NA | 0.07 | NA | 0.08 | NA | 0.72 | NA | 0.81 | NA | 91 | NA | 88 | NA | 0.00 | NA | 0.00 | NA | 2.62 | NA | 2.76 | NA | 0.13 | NA | 0.14 |
| ggml_compute_forward_flash_attn_ext | libggml-cpu.so | 0.81 | 0.67 | 0.78 | 0.63 | 0.04 | 0.03 | 0.04 | 0.03 | 0.09 | 0.07 | 0.10 | 0.07 | 86 | 86 | 86 | 91 | 412.68 | 379.26 | 409.88 | 422.30 | 0.33 | 0.30 | 0.33 | 0.32 | 0.02 | 0.01 | 0.02 | 0.02 |
| ggml_compute_forward_rope_f32(ggml_compute_params const*, ggml_tensor*, bool) | libggml-cpu.so | 0.58 | 0.56 | 0.55 | 0.67 | 0.03 | 0.03 | 0.03 | 0.03 | 0.06 | 0.05 | 0.06 | 0.07 | 96 | 96 | 96 | 96 | 98.72 | 170.45 | 105.11 | 163.34 | 0.21 | 0.22 | 0.25 | 0.27 | 0.01 | 0.01 | 0.01 | 0.01 |
| ggml_vec_dot_f16 | libggml-cpu.so | 0.26 | 0.46 | 0.21 | 0.47 | 0.01 | 0.02 | 0.01 | 0.02 | 0.03 | 0.07 | 0.04 | 0.07 | 86 | 86 | 86 | 86 | 770.02 | 839.73 | 773.22 | 874.30 | 0.16 | 0.25 | 0.15 | 0.28 | 0.01 | 0.01 | 0.01 | 0.01 |
| void parallel_for<(anonymous namespace)::convert_B_packed_format<block_q8_0, 32>(void*, block_q8_0 const*, int, int)::{lambda(int, int)#1}>(int, (anonymous namespace)::convert_B_packed_format<block_q8_0, 32>(void*, block_q8_0 const*, int,... | libggml-cpu.so | 0.66 | NA | 0.60 | NA | 0.04 | NA | 0.03 | NA | 0.06 | NA | 0.06 | NA | 94 | NA | 92 | NA | 0.00 | NA | 0.00 | NA | 0.24 | NA | 0.21 | NA | 0.01 | NA | 0.01 | NA |
| void parallel_for<(anonymous namespace)::convert_B_packed_format<block_q8_0, 32>(void*, block_q8_0 const*, int, int)::{lambda(int, int)#1}>(int, (anonymous namespace)::convert_B_packed_format<block_q8_0, 32>(void*, block_q8_0 const*, int,... | libggml-cpu.so | NA | 0.59 | NA | 0.55 | NA | 0.03 | NA | 0.03 | NA | 0.06 | NA | 0.05 | NA | 90 | NA | 90 | NA | 0.00 | NA | 0.00 | NA | 0.22 | NA | 0.20 | NA | 0.01 | NA | 0.01 |
| __kmp_hyper_barrier_release(barrier_type, kmp_info*, int, int, int, void*) | libiomp5.so | 0.49 | NA | 0.40 | NA | 0.03 | NA | 0.02 | NA | 0.28 | NA | 0.17 | NA | 41 | NA | 37 | NA | 0.00 | NA | 0.00 | NA | 1.26 | NA | 0.89 | NA | 0.07 | NA | 0.05 | NA |
| __kmp_hyper_barrier_gather(barrier_type, kmp_info*, int, int, void (*)(void*, void*), void*) | libiomp5.so | 0.49 | NA | 0.35 | NA | 0.03 | NA | 0.02 | NA | 0.08 | NA | 0.05 | NA | 94 | NA | 92 | NA | 0.00 | NA | 0.00 | NA | 0.28 | NA | 0.21 | NA | 0.01 | NA | 0.01 | NA |
| __GI___sched_yield | libc.so.6 | 0.19 | 0.19 | 0.22 | 0.18 | 0.01 | 0.01 | 0.01 | 0.01 | 0.04 | 0.05 | 0.03 | 0.04 | 80 | 82 | 86 | 77 | 0.00 | 0.00 | 0.00 | 0.00 | 0.12 | 0.14 | 0.13 | 0.16 | 0.01 | 0.01 | 0.01 | 0.01 |
| f64xsubf128 | libm.so.6 | NA | 0.43 | NA | 0.34 | NA | 0.02 | NA | 0.02 | NA | 0.05 | NA | 0.04 | NA | 96 | NA | 96 | NA | 579.09 | NA | 580.89 | NA | 0.22 | NA | 0.20 | NA | 0.01 | NA | 0.01 |
| __libm_sse2_sincosf_l9 | binary | 0.34 | NA | 0.34 | NA | 0.02 | NA | 0.02 | NA | 0.05 | NA | 0.04 | NA | 96 | NA | 96 | NA | 338.22 | NA | 345.83 | NA | 0.18 | NA | 0.18 | NA | 0.01 | NA | 0.01 | NA |
| quantize_row_q8_0 | libggml-cpu.so | 0.08 | 0.12 | 0.11 | 0.11 | 0.00 | 0.01 | 0.01 | 0.01 | 0.43 | 0.56 | 0.55 | 0.50 | 1 | 1 | 1 | 1 | 624.54 | 478.02 | 492.67 | 528.32 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_cpu_fp32_to_fp16 | libggml-cpu.so | 0.07 | 0.12 | 0.13 | 0.06 | 0.00 | 0.01 | 0.01 | 0.00 | 0.02 | 0.03 | 0.03 | 0.03 | 45 | 60 | 64 | 40 | 0.00 | 3.94 | 0.00 | 5.07 | 0.08 | 0.13 | 0.12 | 0.10 | 0.00 | 0.01 | 0.01 | 0.00 |
| kmp_flag_native<unsigned long long, (flag_type)1, true>::done_check() | libiomp5.so | 0.17 | NA | 0.13 | NA | 0.01 | NA | 0.01 | NA | 0.08 | NA | 0.06 | NA | 32 | NA | 27 | NA | 0.00 | NA | 0.00 | NA | 0.37 | NA | 0.31 | NA | 0.02 | NA | 0.02 | NA |
| unknown_function | libggml-cpu.so | 0.06 | 0.12 | 0.06 | 0.06 | 0.00 | 0.01 | 0.00 | 0.00 | 0.02 | 0.02 | 0.02 | 0.03 | 96 | 96 | 96 | 96 | 541.18 | 336.08 | 386.72 | 430.17 | 0.07 | 0.11 | 0.07 | 0.08 | 0.00 | 0.01 | 0.00 | 0.00 |
| __libm_expf_l9 | binary | 0.13 | NA | 0.13 | NA | 0.01 | NA | 0.01 | NA | 0.03 | NA | 0.03 | NA | 86 | NA | 86 | NA | 1579.72 | NA | 1995.10 | NA | 0.13 | NA | 0.12 | NA | 0.01 | NA | 0.01 | NA |
| ggml_vec_swiglu_f32 | libggml-cpu.so | 0.06 | 0.06 | 0.05 | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 | 0.07 | 0.05 | 0.05 | 0.05 | 15 | 15 | 15 | 15 | 3041.43 | 3514.71 | 3656.29 | 2882.46 | 0.44 | 0.39 | 0.32 | 0.44 | 0.02 | 0.02 | 0.02 | 0.02 |
| ggml_graph_compute_thread | libggml-cpu.so | 0.06 | 0.05 | 0.06 | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.02 | 0.02 | 0.02 | 47 | 30 | 45 | 34 | 15.71 | 0.83 | 0.45 | 3.59 | 0.07 | 0.09 | 0.07 | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_rms_norm | libggml-cpu.so | 0.06 | 0.06 | 0.06 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.07 | 0.06 | 0.05 | 0.03 | 11 | 17 | 13 | 12 | 226.73 | 246.27 | 265.71 | 875.02 | 0.41 | 0.40 | 0.36 | 0.13 | 0.02 | 0.02 | 0.02 | 0.01 |
| ggml::cpu::amx::extra_buffer_type::get_tensor_traits(ggml_tensor const*) | libggml-cpu.so | 0.06 | 0.04 | 0.05 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.01 | 0.02 | 0.01 | 47 | 27 | 35 | 34 | 0.00 | 0.00 | 0.00 | 0.00 | 0.05 | 0.05 | 0.06 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_add_non_quantized | libggml-cpu.so | 0.05 | 0.05 | 0.03 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.07 | 0.05 | 0.03 | 0.05 | 16 | 14 | 15 | 15 | 96.45 | 111.12 | 158.37 | 120.63 | 0.36 | 0.38 | 0.20 | 0.31 | 0.02 | 0.02 | 0.01 | 0.02 |
| int __kmp_barrier_template<false>(barrier_type, int, int, unsigned long, void*, void (*)(void*, void*)) [clone .isra.33] | libomp.so | NA | 0.08 | NA | 0.09 | NA | 0.00 | NA | 0.00 | NA | 0.02 | NA | 0.02 | NA | 51 | NA | 56 | NA | 2.28 | NA | 1.79 | NA | 0.08 | NA | 0.09 | NA | 0.00 | NA | 0.00 |
| __kmp_barrier | libiomp5.so | 0.09 | NA | 0.07 | NA | 0.00 | NA | 0.00 | NA | 0.02 | NA | 0.02 | NA | 62 | NA | 54 | NA | 4.83 | NA | 6.15 | NA | 0.07 | NA | 0.07 | NA | 0.00 | NA | 0.00 | NA |
| ggml_compute_forward_mul | libggml-cpu.so | 0.04 | 0.02 | 0.03 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 | 0.02 | 0.02 | 0.04 | 20 | 19 | 23 | 20 | 120.95 | 238.28 | 164.48 | 131.13 | 0.23 | 0.12 | 0.11 | 0.24 | 0.01 | 0.01 | 0.01 | 0.01 |
| syscall | libc.so.6 | 0.03 | 0.02 | 0.02 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 0.01 | 23 | 20 | 18 | 21 | 0.00 | 0.00 | 0.00 | 0.00 | 0.05 | 0.03 | 0.03 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 |
| __tls_get_addr | ld-linux-x86-64.so.2 | 0.00 | 0.03 | 0.00 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 3 | 19 | 3 | 26 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.06 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 |
| __kmp_yield | libiomp5.so | 0.04 | NA | 0.02 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 34 | NA | 19 | NA | 0.00 | NA | 0.00 | NA | 0.04 | NA | 0.03 | NA | 0.00 | NA | 0.00 | NA |
| ggml_backend_amx_mul_mat(ggml_compute_params const*, ggml_tensor*) | libggml-cpu.so | 0.01 | 0.01 | 0.01 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 0.01 | 13 | 10 | 14 | 19 | 25.23 | 12.68 | 82.71 | 65.91 | 0.05 | 0.04 | 0.04 | 0.06 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_cpu_extra_compute_forward | libggml-cpu.so | 0.01 | 0.01 | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 0.01 | 10 | 13 | 7 | 12 | 0.00 | 11.71 | 18.96 | 0.00 | 0.03 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| __intel_avx_rep_memcpy | binary | 0.03 | NA | 0.02 | NA | 0.00 | NA | 0.00 | NA | 0.09 | NA | 0.06 | NA | 11 | NA | 10 | NA | 17.52 | NA | 25.80 | NA | 0.47 | NA | 0.32 | NA | 0.02 | NA | 0.02 | NA |
| ggml_is_empty | libggml-base.so | 0.01 | 0.01 | 0.02 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 0.01 | 5 | 9 | 17 | 5 | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_set_rows | libggml-cpu.so | 0.01 | 0.01 | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 7 | 7 | 11 | 7 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.05 | 0.03 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 |
| __memcpy_avx512_unaligned_erms | libc.so.6 | 0.00 | 0.02 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.07 | 0.00 | 0.06 | 1 | 6 | 1 | 3 | 0.00 | 19.62 | 0.00 | 10.86 | 0.00 | 0.56 | 0.00 | 0.65 | 0.00 | 0.03 | 0.00 | 0.03 |
| __intel_avx_rep_memset | binary | 0.03 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.07 | NA | 0.03 | NA | 15 | NA | 7 | NA | 12.01 | NA | 34.75 | NA | 0.33 | NA | 0.17 | NA | 0.02 | NA | 0.01 | NA |
| __memset_avx512_unaligned_erms | libc.so.6 | NA | 0.02 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.06 | NA | 0.05 | NA | 4 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.55 | NA | 0.00 | NA | 0.03 | NA | 0.00 |
| ggml_compute_forward_glu | libggml-cpu.so | 0.01 | 0.00 | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 0.01 | 7 | 3 | 10 | 5 | 0.00 | 0.00 | 16.85 | 0.00 | 0.04 | 0.00 | 0.03 | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 |
| __kmpc_barrier | libiomp5.so | 0.01 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 17 | NA | 15 | NA | 26.92 | NA | 30.16 | NA | 0.04 | NA | 0.04 | NA | 0.00 | NA | 0.00 | NA |
| std::_Hashtable<std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > >, std::pair<std::pai... | libllama.so | 0.01 | NA | 0.01 | 0.01 | 0.00 | NA | 0.00 | 0.00 | 0.04 | NA | 0.04 | 0.04 | 1 | NA | 1 | 1 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 |
| __kmpc_barrier | libomp.so | NA | 0.01 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 17 | NA | 10 | NA | 16.99 | NA | 22.58 | NA | 0.04 | NA | 0.04 | NA | 0.00 | NA | 0.00 |
| ggml_compute_forward_dup | libggml-cpu.so | 0.00 | 0.00 | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.01 | 0.01 | 5 | 2 | 7 | 7 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_backend_amx_buffer_type() | libggml-cpu.so | 0.01 | 0.00 | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 7 | 3 | 6 | 5 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| __kmp_task_team_sync | libiomp5.so | 0.01 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.00 | NA | 6 | NA | 13 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA |
| __libm_powf_l9 | binary | 0.01 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 30 | NA | 33 | NA | 35.13 | NA | 20.54 | NA | 0.04 | NA | 0.05 | NA | 0.00 | NA | 0.00 | NA |
| __kmp_get_global_thread_id_reg | libomp.so | NA | 0.01 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 10 | NA | 5 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| __memcmp_evex_movbe | libc.so.6 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.03 | 0.02 | 0.02 | 0.02 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| __libm_log2_l9 | binary | 0.01 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.00 | NA | 8 | NA | 8 | NA | 3.15 | NA | 3.16 | NA | 0.08 | NA | 0.04 | NA | 0.00 | NA | 0.00 | NA |
| __log2_finite | libm.so.6 | NA | 0.01 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 8 | NA | 7 | NA | 4.76 | NA | 0.00 | NA | 0.07 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| llama_vocab::impl::load(llama_model_loader&, LLM_KV const&) | libllama.so | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.03 | 0.01 | 0.02 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml::cpu::amx::tensor_traits::compute_forward(ggml_compute_params*, ggml_tensor*) | libggml-cpu.so | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.01 | 0.01 | 3 | 1 | 5 | 5 | 75.68 | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_get_rows | libggml-cpu.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.00 | 0.01 | 2 | 4 | 3 | 4 | 0.00 | 0.00 | 75.82 | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| _int_free | libc.so.6 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.03 | 0.01 | 0.02 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_type_size | libggml-base.so | 0.00 | 0.00 | 0.01 | NA | 0.00 | 0.00 | 0.00 | NA | 0.01 | 0.01 | 0.01 | NA | 2 | 3 | 7 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA |
| __kmp_task_team_sync | libomp.so | NA | 0.00 | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 3 | NA | 7 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.04 | NA | 0.00 | NA | 0.00 |
| ggml_can_repeat | libggml-base.so | NA | 0.00 | 0.00 | 0.01 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.01 | 0.01 | NA | 2 | 3 | 5 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.05 | 0.00 | NA | 0.00 | 0.00 | 0.00 |
| __libm_logf_l9 | binary | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 14 | NA | 20 | NA | 13.51 | NA | 37.91 | NA | 0.05 | NA | 0.04 | NA | 0.00 | NA | 0.00 | NA |
| std::_Hashtable<std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > >, std::pair<std::pai... | libllama.so | NA | 0.01 | NA | NA | NA | 0.00 | NA | NA | NA | 0.05 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| std::__detail::_Map_base<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const, int>, st... | libllama.so | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.02 | NA | 0.02 | 0.02 | 1 | NA | 1 | 1 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 |
| malloc_consolidate | libc.so.6 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.01 | 0.02 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_add | libggml-cpu.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 2 | 3 | 3 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| llama_vocab::impl::~impl() | libllama.so | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.02 | NA | 0.02 | 0.01 | 1 | NA | 1 | 1 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 |
| __kmp_yield | libomp.so | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.01 | NA | 6 | NA | 2 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| _dl_lookup_symbol_x | ld-linux-x86-64.so.2 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 1 | 2 | 2 | 2 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_rope | libggml-cpu.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 0.00 | 2 | 2 | 1 | 3 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| __GI___libc_malloc | libc.so.6 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.01 | 0.02 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_view | libggml-cpu.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.01 | 0.00 | 4 | 1 | 2 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| sched_yield@plt | libomp.so | NA | 0.01 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.00 | NA | 5 | NA | 2 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| std::_Hash_bytes(void const*, unsigned long, unsigned long) | libstdc++.so.6.0.29 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.02 | 0.00 | 0.02 | NA | 1 | 1 | 1 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 |
| ggml_rope_yarn_corr_dims | libggml-base.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 16 | 18 | 10 | 21 | 122.97 | NA | 42.65 | 60.20 | 0.03 | 0.00 | 0.04 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 |
| unlink_chunk.constprop.0 | libc.so.6 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.01 | 0.01 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_compute_forward_reshape | libggml-cpu.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 2 | 2 | 2 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| std::pair<std::__detail::_Node_iterator<std::pair<std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<c... | libllama.so | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.03 | NA | 1 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA |
| std::basic_ostream<char, std::char_traits<char> >& std::__ostream_insert<char, std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&, char const*, long) | libstdc++.so.6.0.29 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| _IO_fread | libc.so.6 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.01 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| .plt.sec@start | libstdc++.so.6.0.29 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.01 | 0.02 | 0.00 | NA | 1 | 1 | 1 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 |
| std::_Hashtable<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const, unsigned char>, s... | libllama.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.01 | 0.00 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml::cpu::repack::extra_buffer_type::get_tensor_traits(ggml_tensor const*) | libggml-cpu.so | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.01 | 0.00 | 2 | NA | 3 | 1 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 |
| llama_kv_cache::set_input_kq_mask(ggml_tensor*, llama_ubatch const*, bool) const | libllama.so | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.01 | 0.00 | 0.02 | NA | 1 | 1 | 1 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA |
| __kmp_resume_if_soft_paused | libiomp5.so | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 6 | NA | 4 | NA | 151.35 | NA | 3.16 | NA | 0.05 | NA | 0.05 | NA | 0.00 | NA | 0.00 | NA |
| _intel_fast_memset | binary | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.00 | NA | 6 | NA | 3 | NA | 1.89 | NA | 18.96 | NA | 0.04 | NA | 0.05 | NA | 0.00 | NA | 0.00 | NA |
| std::_Hashtable<std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > >, std::pair<std::pai... | libllama.so | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.02 | NA | 1 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| __memchr_evex | libc.so.6 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.02 | 1 | 1 | NA | 1 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 |
| __GI___libc_free | libc.so.6 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 1 | 1 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| ggml_is_contiguous | libggml-base.so | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 1 | 2 | 1 | 1 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| unknown_function | libllama.so | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.01 | NA | 0.00 | 0.01 | 1 | NA | 1 | 1 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 |
| .plt.sec@start | libiomp5.so | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 5 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __kmp_enter_single | libomp.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 4 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >::compare(char const*) const | libstdc++.so.6.0.29 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.01 | 1 | 1 | NA | 1 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 |
| ggml_are_same_shape | libggml-base.so | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 1 | 2 | 1 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 |
| __strlen_evex | libc.so.6 | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.01 | 0.00 | NA | 1 | 1 | 1 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA |
| ggml_backend_cpu_get_extra_buffer_types() | libggml-cpu.so | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.01 | 0.00 | NA | NA | 2 | 2 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA |
| __kmp_enter_single | libiomp5.so | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 4 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __tls_get_addr@plt | libomp.so | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 3 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| ggml_compute_forward_permute | libggml-cpu.so | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 1 | NA | 2 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| std::_Hashtable<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const, int>, std::alloca... | libllama.so | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.01 | NA | 0.00 | NA | 1 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| __kmp_resume_if_soft_paused | libomp.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 3 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| unicode_cpts_from_utf8(std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&) | libllama.so | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 1 | 1 | 1 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 |
| ggml_nrows | libggml-base.so | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.01 | NA | 0.01 | 1 | 1 | NA | 1 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 |
| do_lookup_x | ld-linux-x86-64.so.2 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 1 | 1 | NA | 1 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 |
| ggml_barrier | libggml-cpu.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 3 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| __libm_expf_e7 | binary | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 2 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA |
| __kmp_join_barrier(int) | libiomp5.so | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 2 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA |
| __kmpc_global_thread_num | libiomp5.so | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 2 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA |
| __svml_logf4_l9 | binary | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 14 | NA | 8 | NA | 56.76 | NA | 66.34 | NA | 0.03 | NA | 0.03 | NA | 0.00 | NA | 0.00 | NA |
| __kmp_finish_implicit_task | libomp.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 2 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| _dl_fixup | ld-linux-x86-64.so.2 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 1 | 1 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 |
| ggml_is_contiguous_1 | libggml-base.so | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.01 | NA | NA | 0.00 | 1 | NA | NA | 1 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 |
| gguf_get_arr_str | libggml-base.so | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 1 | 1 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA |
| replace_all(std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&, std::__cxx11::basic_string<... | libllama.so | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 1 | 1 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA |
| std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >::_M_append(char const*, unsigned long) | libstdc++.so.6.0.29 | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 1 | 1 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA |
| dequantize_row_q8_0 | libggml-base.so | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA | 3 | 1 | 2 | NA | 56.76 | 0.00 | NA | NA | 0.06 | 0.00 | 0.00 | NA | 0.00 | 0.00 | 0.00 | NA |
| unknown_function | libggml-base.so | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 3 | 9 | NA | NA | 47.30 | 76.11 | NA | NA | 0.05 | 0.03 | NA | NA | 0.00 | 0.00 | NA | NA |
| __kmp_get_global_thread_id_reg | libiomp5.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 2 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| _IO_file_xsgetn | libc.so.6 | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| __libm_exp2f_z0 | binary | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 4 | NA | 7 | NA | NA | NA | 23.69 | NA | 0.00 | NA | 0.05 | NA | 0.00 | NA | 0.00 | NA |
| bool gguf_read_emplace_helper<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > >(gguf_reader const&, std::vector<gguf_kv, std::allocator<gguf_kv> >&, std::__cxx11::basic_string<c... | libggml-base.so | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA |
| exp2f | binary | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 2 | NA | 0.00 | NA | 9.48 | NA | 0.00 | NA | 0.07 | NA | 0.00 | NA | 0.00 | NA |
| ggml_get_glu_op | libggml-base.so | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 1 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA |
| ggml_graph_plan | libggml-cpu.so | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >* std::__uninitialized_copy<false>::__uninit_copy<__gnu_cxx::__normal_iterator<std::__cxx11::basic_string<char, std::char_traits<char>, st... | binary | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| __vfscanf_internal | libc.so.6 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| std::vector<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::allocator<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > > >::_M_default_appe... | libggml-base.so | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| __kmp_init_implicit_task | libomp.so | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| __GI___libc_cleanup_pop_restore | libc.so.6 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| std::_Hashtable<std::pair<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > >, std::pair<std::pai... | libllama.so | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| __kmpc_global_thread_num | libomp.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| OmptReturnAddressGuard::OmptReturnAddressGuard(int, void*) | libomp.so | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 1 | NA | 0.00 | NA | NA | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| ggml_backend_sched_backend_id_from_cur(ggml_backend_sched*, ggml_tensor*) | libggml-base.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| ggml_nelements | libggml-base.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| std::vector<gguf_kv, std::allocator<gguf_kv> >::~vector() | libggml-base.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| _IO_setb | libc.so.6 | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| __malloc_arena_thread_freeres | libc.so.6 | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| __kmp_invoke_task_func | libomp.so | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| __kmp_barrier | libomp.so | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 5 | NA | 0.00 | NA | NA | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| _IO_sgetn | libc.so.6 | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA |
| gguf_free | libggml-base.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| ggml_get_type_traits | libggml-base.so | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 1 | 1 | NA | NA | NA | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA |
| _dl_addr | libc.so.6 | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| llama_kv_cache::prepare(std::vector<llama_ubatch, std::allocator<llama_ubatch> > const&) | libllama.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| rml::internal::internalPoolMalloc(rml::internal::MemoryPool*, unsigned long) | libiomp5.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| __kmp_api_omp_get_thread_num | libiomp5.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| __intel_skx_avx512_memcpy | binary | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| __kmpc_bound_num_threads | libiomp5.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| __libm_sse2_sincosf | binary | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 2 | NA | NA | NA | 9.48 | NA | 0.00 | NA | 0.07 | NA | 0.00 | NA | 0.00 | NA |
| __kmp_launch_thread | libiomp5.so | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| common_log_main() | binary | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| unicode_cpt_flags_array() | libllama.so | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __futex_abstimed_wait_common | libc.so.6 | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __GI___pthread_cleanup_pop | libc.so.6 | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __GI___pthread_mutex_init | libc.so.6 | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| powf | binary | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 2 | NA | NA | NA | 9.46 | NA | NA | NA | 0.07 | NA | NA | NA | 0.00 | NA | NA | NA |
| ceilf | binary | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 8 | NA | NA | NA | 66.22 | NA | NA | NA | 0.03 | NA | NA | NA | 0.00 | NA | NA | NA |
| __vfprintf_internal | libc.so.6 | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __kmp_init_implicit_task | libiomp5.so | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >::resize(unsigned long, char) | libstdc++.so.6.0.29 | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| std::vector<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::allocator<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > > >::operator=(std::... | binary | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >::reserve(unsigned long) | libstdc++.so.6.0.29 | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __kmp_finish_implicit_task | libiomp5.so | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.01 | NA | NA | NA | 1 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| expm1f | libm.so.6 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 1 | NA | NA | NA | NA | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| _intel_fast_memcpy | binary | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 2 | NA | NA | NA | NA | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA |
| unknown_kernel_region | kernel | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA | NA | 1 | 1 | NA | NA | NA | NA | NA | NA | 0.00 | 0.00 | NA | NA | 0.00 | 0.00 | NA |
| tanhf | libm.so.6 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 1 | NA | 1 | NA | NA | NA | NA | NA | 0.00 | NA | 0.00 | NA | 0.00 | NA | 0.00 |
| ggml_cpu_init | libggml-cpu.so | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | NA | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |
| __svml_logf4 | binary | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | NA | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| __libm_floorf_y8 | binary | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 2 | NA | NA | NA | NA | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| floorf | binary | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 1 | NA | NA | NA | NA | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA |
| ggml_get_type_traits_cpu | libggml-cpu.so | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 | NA | NA | NA | 2 | NA | NA | NA | NA | NA | NA | NA | 0.00 | NA | NA | NA | 0.00 |