Replace CL_REQUIRE/CL_PROVIDE(cl_C_ring) with portable code.

[cln.git] / src / base / digitseq / cl_DS_mul_fftcs.h
diff --git a/src/base/digitseq/cl_DS_mul_fftcs.h b/src/base/digitseq/cl_DS_mul_fftcs.h

index f63ea29a9ea6d4aa16339a1b8f637f6998eefcc4..6269bf23fb0575079211badba77f1d3555c0e613 100644 (file)
--- a/src/base/digitseq/cl_DS_mul_fftcs.h
+++ b/src/base/digitseq/cl_DS_mul_fftcs.h
@@ -270,8 +270,7 @@
  
  
  #include "cln/floatparam.h"
-#include "cln/io.h"
-#include "cln/abort.h"
+#include "cln/exception.h"
  
  
  #if defined(HAVE_LONGDOUBLE) && (long_double_mant_bits > double_mant_bits) && (defined(__i386__) || defined(__m68k__) || (defined(__sparc__) && 0))
@@ -460,10 +459,10 @@ static inline void mul (const fftcs_complex& a, const fftcs_complex& b, fftcs_co
         r.im = r_im;
  }
  
-static uintL shuffle (uintL n, uintL x)
+static uintC shuffle (uintL n, uintC x)
  {
-       var uintL y = 0;
-       var sintL v = 1;
+       var uintC y = 0;
+       var sintC v = 1;
         // Invariant: y + v*shuffle(n,x).
         do {
                 if (x & 1)
@@ -475,30 +474,30 @@ static uintL shuffle (uintL n, uintL x)
                         }
                 x >>= 1;
         } while (!(--n == 0));
-       cl_abort();
+       throw runtime_exception();
  }
  
  #if 0 // unused
-static uintL invshuffle (uintL n, uintL x)
+static uintC invshuffle (uintL n, uintC x)
  {
-       var uintL y = 0;
-       var uintL v = 1;
+       var uintC y = 0;
+       var uintC v = 1;
         // Invariant: y + v*invshuffle(n,x).
         do {
-               if (x == ((uintL)1 << (n-1)))
+               if (x == ((uintC)1 << (n-1)))
                         return y + v;
-               else if (x > ((uintL)1 << (n-1))) {
-                       x = ((uintL)1 << n) - x;
+               else if (x > ((uintC)1 << (n-1))) {
+                       x = ((uintC)1 << n) - x;
                         y = y+v;
                 }
                 v <<= 1;
         } while (!(--n == 0));
-       cl_abort();
+       throw runtime_exception();
  }
  #endif
  
  // Compute a real convolution using FFT: z[0..N-1] := x[0..N-1] * y[0..N-1].
-static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
+static void fftcs_convolution (const uintL n, const uintC N, // N = 2^n
                                 fftcs_real * x, // N numbers
                                 fftcs_real * y, // N numbers
                                 fftcs_real * z  // N numbers result
@@ -506,7 +505,7 @@ static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
  {
         CL_ALLOCA_STACK;
         var fftcs_complex* const w = cl_alloc_array(fftcs_complex,N>>2);
-       var uintL i;
+       var uintC i;
         // Initialize w[i] to w^i, w a primitive N-th root of unity.
         w[0] = fftcs_roots_of_1[0];
         {
@@ -524,10 +523,10 @@ static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
                 var uintL l;
                 for (l = n-1; l > 0; l--) {
                         /* s = 0 */ {
-                               var const uintL tmax = (uintL)1 << l;
-                               for (var uintL t = 0; t < tmax; t++) {
-                                       var uintL i1 = t;
-                                       var uintL i2 = i1 + tmax;
+                               var const uintC tmax = (uintC)1 << l;
+                               for (var uintC t = 0; t < tmax; t++) {
+                                       var uintC i1 = t;
+                                       var uintC i2 = i1 + tmax;
                                         // replace (x[i1],x[i2]) by
                                         // (x[i1] + x[i2], x[i1] - x[i2])
                                         var fftcs_real tmp;
@@ -536,15 +535,15 @@ static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
                                         x[i1] = x[i1] + tmp;
                                 }
                         }
-                       var const uintL smax = (uintL)1 << (n-1-l);
-                       var const uintL tmax = (uintL)1 << (l-1);
-                       for (var uintL s = 1; s < smax; s++) {
-                               var uintL exp = shuffle(n-1-l,s) << (l-1);
-                               for (var uintL t = 0; t < tmax; t++) {
-                                       var uintL i1 = (s << (l+1)) + t;
-                                       var uintL i2 = i1 + tmax;
-                                       var uintL i3 = i2 + tmax;
-                                       var uintL i4 = i3 + tmax;
+                       var const uintC smax = (uintC)1 << (n-1-l);
+                       var const uintC tmax = (uintC)1 << (l-1);
+                       for (var uintC s = 1; s < smax; s++) {
+                               var uintC exp = shuffle(n-1-l,s) << (l-1);
+                               for (var uintC t = 0; t < tmax; t++) {
+                                       var uintC i1 = (s << (l+1)) + t;
+                                       var uintC i2 = i1 + tmax;
+                                       var uintC i3 = i2 + tmax;
+                                       var uintC i4 = i3 + tmax;
                                         // replace (x[i1],x[i2],x[i3],x[i4]) by
                                         // (x[i1] + x[i2]*Re(w^exp) - x[i4]*Im(w^exp),
                                         //  x[i3] + x[i4]*Re(w^exp) + x[i2]*Im(w^exp),
@@ -578,10 +577,10 @@ static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
                 var uintL l;
                 for (l = n-1; l > 0; l--) {
                         /* s = 0 */ {
-                               var const uintL tmax = (uintL)1 << l;
-                               for (var uintL t = 0; t < tmax; t++) {
-                                       var uintL i1 = t;
-                                       var uintL i2 = i1 + tmax;
+                               var const uintC tmax = (uintC)1 << l;
+                               for (var uintC t = 0; t < tmax; t++) {
+                                       var uintC i1 = t;
+                                       var uintC i2 = i1 + tmax;
                                         // replace (y[i1],y[i2]) by
                                         // (y[i1] + y[i2], y[i1] - y[i2])
                                         var fftcs_real tmp;
@@ -590,15 +589,15 @@ static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
                                         y[i1] = y[i1] + tmp;
                                 }
                         }
-                       var const uintL smax = (uintL)1 << (n-1-l);
-                       var const uintL tmax = (uintL)1 << (l-1);
-                       for (var uintL s = 1; s < smax; s++) {
-                               var uintL exp = shuffle(n-1-l,s) << (l-1);
-                               for (var uintL t = 0; t < tmax; t++) {
-                                       var uintL i1 = (s << (l+1)) + t;
-                                       var uintL i2 = i1 + tmax;
-                                       var uintL i3 = i2 + tmax;
-                                       var uintL i4 = i3 + tmax;
+                       var const uintC smax = (uintC)1 << (n-1-l);
+                       var const uintC tmax = (uintC)1 << (l-1);
+                       for (var uintC s = 1; s < smax; s++) {
+                               var uintC exp = shuffle(n-1-l,s) << (l-1);
+                               for (var uintC t = 0; t < tmax; t++) {
+                                       var uintC i1 = (s << (l+1)) + t;
+                                       var uintC i2 = i1 + tmax;
+                                       var uintC i3 = i2 + tmax;
+                                       var uintC i4 = i3 + tmax;
                                         // replace (y[i1],y[i2],y[i3],y[i4]) by
                                         // (y[i1] + y[i2]*Re(w^exp) - y[i4]*Im(w^exp),
                                         //  y[i3] + y[i4]*Re(w^exp) + y[i2]*Im(w^exp),
@@ -649,10 +648,10 @@ static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
                 }
                 for (l = 1; l < n; l++) {
                         /* s = 0 */ {
-                               var const uintL tmax = (uintL)1 << l;
-                               for (var uintL t = 0; t < tmax; t++) {
-                                       var uintL i1 = t;
-                                       var uintL i2 = i1 + tmax;
+                               var const uintC tmax = (uintC)1 << l;
+                               for (var uintC t = 0; t < tmax; t++) {
+                                       var uintC i1 = t;
+                                       var uintC i2 = i1 + tmax;
                                         // replace (z[i1],z[i2]) by
                                         // ((z[i1]+z[i2])/2, (z[i1]-z[i2])/2)
                                         // Do the division by 2 later.
@@ -662,15 +661,15 @@ static void fftcs_convolution (const uintL n, const uintL N, // N = 2^n
                                         z[i1] = z[i1] + tmp;
                                 }
                         }
-                       var const uintL smax = (uintL)1 << (n-1-l);
-                       var const uintL tmax = (uintL)1 << (l-1);
-                       for (var uintL s = 1; s < smax; s++) {
-                               var uintL exp = shuffle(n-1-l,s) << (l-1);
-                               for (var uintL t = 0; t < tmax; t++) {
-                                       var uintL i1 = (s << (l+1)) + t;
-                                       var uintL i2 = i1 + tmax;
-                                       var uintL i3 = i2 + tmax;
-                                       var uintL i4 = i3 + tmax;
+                       var const uintC smax = (uintC)1 << (n-1-l);
+                       var const uintC tmax = (uintC)1 << (l-1);
+                       for (var uintC s = 1; s < smax; s++) {
+                               var uintC exp = shuffle(n-1-l,s) << (l-1);
+                               for (var uintC t = 0; t < tmax; t++) {
+                                       var uintC i1 = (s << (l+1)) + t;
+                                       var uintC i2 = i1 + tmax;
+                                       var uintC i3 = i2 + tmax;
+                                       var uintC i4 = i3 + tmax;
                                         // replace (z[i1],z[i2],z[i3],z[i4]) by
                                         // ((z[i1]+z[i3])/2,
                                         //  (z[i1]-z[i3])/2*Re(w^exp)+(z[i2]+z[i4])/2*Im(w^exp),
@@ -720,15 +719,14 @@ static int max_l_table[32+1] =
  
  // Split len uintD's below sourceptr into chunks of l bits, thus filling
  // N real numbers at x.
-static void fill_factor (uintL N, fftcs_real* x, uintL l,
-                         const uintD* sourceptr, uintL len)
+static void fill_factor (uintC N, fftcs_real* x, uintL l,
+                         const uintD* sourceptr, uintC len)
  {
-       var uintL i;
+       var uintC i;
         if (max_l(2) > intDsize && l > intDsize) {
                 // l > intDsize
                 if (max_l(2) > 64 && l > 64) {
-                       fprint(std::cerr, "FFT problem: l > 64 not supported by pow2_table\n");
-                       cl_abort();
+                       throw runtime_exception("FFT problem: l > 64 not supported by pow2_table");
                 }
                 var fftcs_real carry = 0;
                 var sintL carrybits = 0; // number of bits in carry (>=0, <l)
@@ -751,11 +749,11 @@ static void fill_factor (uintL N, fftcs_real* x, uintL l,
                         i++;
                 }
                 if (i > N)
-                       cl_abort();
+                       throw runtime_exception();
         } else if (max_l(2) >= intDsize && l == intDsize) {
                 // l = intDsize
                 if (len > N)
-                       cl_abort();
+                       throw runtime_exception();
                 for (i = 0; i < len; i++) {
                         var uintD digit = lsprefnext(sourceptr);
                         x[i] = (fftcs_real)digit;
@@ -782,14 +780,14 @@ static void fill_factor (uintL N, fftcs_real* x, uintL l,
                 }
                 while (carrybits > 0) {
                         if (!(i < N))
-                               cl_abort();
+                               throw runtime_exception();
                         x[i] = (fftcs_real)(carry & l_mask);
                         carry >>= l;
                         carrybits -= l;
                         i++;
                 }
                 if (len > 0)
-                       cl_abort();
+                       throw runtime_exception();
         }
         for ( ; i < N; i++)
                 x[i] = (fftcs_real)0;
@@ -840,11 +838,11 @@ static inline fftcs_real fftcs_ffloor (fftcs_real x)
  // The z[i] are known to be approximately integers >= 0, < N*2^(2*l).
  // Assumes room for floor(N*l/intDsize)+(1+ceiling((n+2*l)/intDsize)) uintD's
  // below destptr. Fills len digits and returns (destptr lspop len).
-static uintD* unfill_product (uintL n, uintL N, // N = 2^n
+static uintD* unfill_product (uintL n, uintC N, // N = 2^n
                                const fftcs_real * z, uintL l,
                                uintD* destptr)
  {
-       var uintL i;
+       var uintC i;
         if (n + 2*l <= intDsize) {
                 // 2-digit carry is sufficient, l < intDsize
                 var uintD carry0 = 0;
@@ -942,7 +940,7 @@ static uintD* unfill_product (uintL n, uintL N, // N = 2^n
                         if (!(digit >= (fftcs_real)0
                               && z[i] > digit - (fftcs_real)0.5
                               && z[i] < digit + (fftcs_real)0.5))
-                               cl_abort();
+                               throw runtime_exception();
                         #endif
                         if (shift > 0)
                                 digit = digit * fftcs_pow2_table[shift];
@@ -990,35 +988,34 @@ static inline void mulu_fftcs_nocheck (const uintD* sourceptr1, uintC len1,
         // is  2*len1*intDsize/l_max - 1 <= 2^k.
         {
                 var const int l = max_l(2);
-               var uintL lhs = 2*ceiling((uintL)len1*intDsize,l) - 1; // >=1
+               var uintC lhs = 2*ceiling(len1*intDsize,l) - 1; // >=1
                 if (lhs < 3)
                         k = 2;
                 else
-                       integerlength32(lhs-1, k=); // k>=2
+                       integerlengthC(lhs-1, k=); // k>=2
         }
         // Try whether this k is ok or whether we have to increase k.
         for ( ; ; k++) {
                 if (k >= sizeof(max_l_table)/sizeof(max_l_table[0])
                     || max_l_table[k] <= 0) {
-                       fprint(std::cerr, "FFT problem: numbers too big, floating point precision not sufficient\n");
-                       cl_abort();
+                       throw runtime_exception("FFT problem: numbers too big, floating point precision not sufficient");
                 }
-               if (2*ceiling((uintL)len1*intDsize,max_l_table[k])-1 <= ((uintL)1 << k))
+               if (2*ceiling(len1*intDsize,max_l_table[k])-1 <= ((uintC)1 << k))
                         break;
         }
         // We could try to reduce l, keeping the same k. But why should we?
         // Calculate the number of pieces in which source2 will have to be
         // split. Each of the pieces must satisfy
         // ceiling(len1*intDsize/l) + ceiling(len2*intDsize/l) - 1 <= 2^k,
-       var uintL len2p;
+       var uintC len2p;
         // Try once with k, once with k+1. Compare them.
         {
-               var uintL remaining_k = ((uintL)1 << k) + 1 - ceiling((uintL)len1*intDsize,max_l_table[k]);
-               var uintL max_piecelen_k = floor(remaining_k*max_l_table[k],intDsize);
-               var uintL numpieces_k = ceiling(len2,max_piecelen_k);
-               var uintL remaining_k1 = ((uintL)1 << (k+1)) + 1 - ceiling((uintL)len1*intDsize,max_l_table[k+1]);
-               var uintL max_piecelen_k1 = floor(remaining_k1*max_l_table[k+1],intDsize);
-               var uintL numpieces_k1 = ceiling(len2,max_piecelen_k1);
+               var uintC remaining_k = ((uintC)1 << k) + 1 - ceiling(len1*intDsize,max_l_table[k]);
+               var uintC max_piecelen_k = floor(remaining_k*max_l_table[k],intDsize);
+               var uintC numpieces_k = ceiling(len2,max_piecelen_k);
+               var uintC remaining_k1 = ((uintC)1 << (k+1)) + 1 - ceiling(len1*intDsize,max_l_table[k+1]);
+               var uintC max_piecelen_k1 = floor(remaining_k1*max_l_table[k+1],intDsize);
+               var uintC numpieces_k1 = ceiling(len2,max_piecelen_k1);
                 if (numpieces_k <= 2*numpieces_k1) {
                         // keep k
                         len2p = max_piecelen_k;
@@ -1030,7 +1027,7 @@ static inline void mulu_fftcs_nocheck (const uintD* sourceptr1, uintC len1,
         }
         var const uintL l = max_l_table[k];
         var const uintL n = k;
-       var const uintL N = (uintL)1 << n;
+       var const uintC N = (uintC)1 << n;
         CL_ALLOCA_STACK;
         var fftcs_real* const x = cl_alloc_array(fftcs_real,N);
         var fftcs_real* const y = cl_alloc_array(fftcs_real,N);
@@ -1040,9 +1037,9 @@ static inline void mulu_fftcs_nocheck (const uintD* sourceptr1, uintC len1,
         var fftcs_real* const z = x; // put z in place of x - saves memory
         #endif
         var uintD* const tmpprod1 = cl_alloc_array(uintD,len1+1);
-       var uintL tmpprod_len = floor(l<<n,intDsize)+6;
+       var uintC tmpprod_len = floor(l<<n,intDsize)+6;
         var uintD* const tmpprod = cl_alloc_array(uintD,tmpprod_len);
-       var uintL destlen = len1+len2;
+       var uintC destlen = len1+len2;
         clear_loop_lsp(destptr,destlen);
         do {
                 if (len2p > len2)
@@ -1053,7 +1050,7 @@ static inline void mulu_fftcs_nocheck (const uintD* sourceptr1, uintC len1,
                         mulu_loop_lsp(lspref(sourceptr2,0),sourceptr1,tmpptr,len1);
                         if (addto_loop_lsp(tmpptr,destptr,len1+1))
                                 if (inc_loop_lsp(destptr lspop (len1+1),destlen-(len1+1)))
-                                       cl_abort();
+                                       throw runtime_exception();
                 } else {
                         var bool squaring = ((sourceptr1 == sourceptr2) && (len1 == len2p));
                         // Fill factor x.
@@ -1071,31 +1068,31 @@ static inline void mulu_fftcs_nocheck (const uintD* sourceptr1, uintC len1,
                         {
                                 var fftcs_real re_lo_limit = (fftcs_real)(-0.5);
                                 var fftcs_real re_hi_limit = (fftcs_real)N * fftcs_pow2_table[l] * fftcs_pow2_table[l] + (fftcs_real)0.5;
-                               for (var uintL i = 0; i < N; i++)
+                               for (var uintC i = 0; i < N; i++)
                                         if (!(z[i] > re_lo_limit
                                               && z[i] < re_hi_limit))
-                                               cl_abort();
+                                               throw runtime_exception();
                         }
                         #endif
                         var uintD* tmpLSDptr = arrayLSDptr(tmpprod,tmpprod_len);
                         var uintD* tmpMSDptr = unfill_product(n,N,z,l,tmpLSDptr);
-                       var uintL tmplen =
+                       var uintC tmplen =
                           #if CL_DS_BIG_ENDIAN_P
                             tmpLSDptr - tmpMSDptr;
                           #else
                             tmpMSDptr - tmpLSDptr;
                           #endif
                         if (tmplen > tmpprod_len)
-                         cl_abort();
+                         throw runtime_exception();
                         // Add result to destptr[-destlen..-1]:
                         if (tmplen > destlen) {
                                 if (test_loop_msp(tmpMSDptr,tmplen-destlen))
-                                       cl_abort();
+                                       throw runtime_exception();
                                 tmplen = destlen;
                         }
                         if (addto_loop_lsp(tmpLSDptr,destptr,tmplen))
                                 if (inc_loop_lsp(destptr lspop tmplen,destlen-tmplen))
-                                       cl_abort();
+                                       throw runtime_exception();
                 }
                 // Decrement len2.
                 destptr = destptr lspop len2p;
@@ -1150,7 +1147,6 @@ static void mulu_fftcs (const uintD* sourceptr1, uintC len1,
         var uintD checksum = multiply_checksum(checksum1,checksum2);
         mulu_fftcs_nocheck(sourceptr1,len1,sourceptr2,len2,destptr);
         if (!(checksum == compute_checksum(destptr,len1+len2))) {
-               fprint(std::cerr, "FFT problem: checksum error\n");
-               cl_abort();
+               throw runtime_exception("FFT problem: checksum error");
         }
  }