6#define CUDA_CHECK(err) cuda_check(__FILE__, __LINE__, err)
void cuda_check(const char *fname, const int line, const cudaError_t err)
__global__ void dirichlet_apply_scalar_kernel(const int *__restrict__ msk, T *__restrict__ x, const T g, const int m)