FK20-CUDAdocs/fr_8cu_source.html

 // bls12_381: Arithmetic for BLS12-381

 // Copyright 2022-2023 Dag Arne Osvik

 // Copyright 2022-2023 Luan Cardoso dos Santos


 #include <stdio.h>


 #include "fr.cuh"


 __device__ __host__ void fr_zero(fr_t &z) {

     for (int i=0; i<4; i++)

         z[i] = 0;

 }


 __device__ __host__ void fr_one(fr_t &z) {

     z[0] = 1;

     for (int i=1; i<4; i++)

         z[i] = 0;

 }


 __device__ void fr_print(const char *s, const fr_t &x) {

     fr_t t;

     fr_cpy(t, x);

     fr_reduce4(t);

     printf("%s", s);

     printf("%016lX%016lX%016lX%016lX\n",    // dc

 //  printf("#x%016lx%016lx%016lx%016lx\n",  // clisp compatible format

 //  printf("0x%016lx%016lx%016lx%016lx\n",  // python compatible format

     t[3], t[2], t[1], t[0]);

 }


 __device__ __host__ void fr_fromUint64(fr_t &z, const uint64_t *x) {

     z[0] = x[0];

     z[1] = x[1];

     z[2] = x[2];

     z[3] = x[3];

 }


 __device__ void fr_toUint64(const fr_t &x, uint64_t *z) {

     fr_t t;

     fr_cpy(t, x);

     fr_reduce4(t);


     z[0] = x[0];

     z[1] = x[1];

     z[2] = x[2];

     z[3] = x[3];

 }


 __global__ void fr_eq_wrapper(uint8_t *eq, int count, const fr_t *x, const fr_t *y) {


     unsigned tid = 0;   tid += blockIdx.z;

     tid *= gridDim.y;   tid += blockIdx.y;

     tid *= gridDim.x;   tid += blockIdx.x;

     tid *= blockDim.z;  tid += threadIdx.z;

     tid *= blockDim.y;  tid += threadIdx.y;

     tid *= blockDim.x;  tid += threadIdx.x;


     unsigned step = gridDim.z * gridDim.y * gridDim.x

                 * blockDim.z * blockDim.y * blockDim.x;


     for (unsigned i=tid; i<count; i+=step)

         eq[i] = fr_eq(x[i], y[i]);

 }


 // vim: ts=4 et sw=4 si

fr_fromUint64
__device__ __host__ void fr_fromUint64(fr_t &z, const uint64_t *x)
Converts from uint64_t[4] to a residue modulo r, without reduction.
Definition: fr.cu:59

fr_print
__device__ void fr_print(const char *s, const fr_t &x)
prints the canonical representation of x to STDOUT.
Definition: fr.cu:41

fr_eq_wrapper
__global__ void fr_eq_wrapper(uint8_t *eq, int count, const fr_t *x, const fr_t *y)
Checks equality of two arrays of fr_t, element wise, and store in a byte array.
Definition: fr.cu:99

fr_zero
__device__ __host__ void fr_zero(fr_t &z)
Sets the value of z to zero.
Definition: fr.cu:15

fr_toUint64
__device__ void fr_toUint64(const fr_t &x, uint64_t *z)
Converts fr_t to uint64_t[4].
Definition: fr.cu:76

fr_one
__device__ __host__ void fr_one(fr_t &z)
Sets the value of z to one.
Definition: fr.cu:26

fr.cuh

fr_eq
__device__ bool fr_eq(const fr_t &x, const fr_t &y)
Compares two residues modulo r.
Definition: fr_eq.cu:13

fr_t
uint64_t fr_t[4]
Subgroup element stored as a 256-bit array (a 4-element little-endian array of uint64_t)....
Definition: fr.cuh:24

fr_cpy
__device__ __host__ void fr_cpy(fr_t &z, const fr_t &x)
Copy from x into z.
Definition: fr_cpy.cu:14

fr_reduce4
__device__ void fr_reduce4(fr_t &z)
Reduced the value in fr_t to the field modulus.
Definition: fr_reduce4.cu:16