52                               void *
b1, 
void *
b2, 
void *
b3,
 
   56    const dim3 nblcks(((*n)+1024 - 1)/ 1024, 1, 1);
 
 
   68                                  void *z1, 
void *z2, 
void *z3,
 
   73    const dim3 nblcks(((*n)+1024 - 1)/ 1024, 1, 1);
 
 
   88                                  void *p1, 
void *p2, 
void *p3,
 
   89                                  void *alpha, 
int *
p_cur, 
int *n) {
 
   92    const dim3 nblcks(((*n)+1024 - 1)/ 1024, 1, 1);
 
   99                       (
const real **) p1, (
const real **) p2,
 
  100                       (
const real **) p3, (
const real *) alpha,
 
 
  106                               void *
c1, 
void *
c2, 
void *
c3, 
void *alpha_d ,
 
  110    const dim3 nblcks(((*n)+1024 - 1)/ 1024, 1, 1);
 
  111    const int nb = ((*n) + 1024 - 1)/ 1024;
 
  147#ifdef HAVE_DEVICE_MPI 
 
__global__ void dirichlet_apply_scalar_kernel(const int *__restrict__ msk, T *__restrict__ x, const T g, const int m)
 
void device_mpi_allreduce(void *buf_d, void *buf, int count, int nbytes, int op)
 
void hip_fusedcg_cpld_update_x(void *x1, void *x2, void *x3, void *p1, void *p2, void *p3, void *alpha, int *p_cur, int *n)
 
void hip_fusedcg_cpld_update_p(void *p1, void *p2, void *p3, void *z1, void *z2, void *z3, void *po1, void *po2, void *po3, real *beta, int *n)
 
real hip_fusedcg_cpld_part2(void *a1, void *a2, void *a3, void *b, void *c1, void *c2, void *c3, void *alpha_d, real *alpha, int *p_cur, int *n)
 
void hip_fusedcg_cpld_part1(void *a1, void *a2, void *a3, void *b1, void *b2, void *b3, void *tmp, int *n)
 
real * fusedcg_cpld_buf_d