#pragma once
void mat_mul(float *_A, float *_B, float *_C, int _M, int _N, int _K);
void mat_mul_init(float *A, float *B, float *C, int M, int N, int K);
void mat_mul_final(float *A, float *B, float *C, int M, int N, int K);