__kernel void sgemm(__global float *A, __global float *B, __global float *C, int M, int N, int K) {
// TODO: FILL_IN_HERE
}