SSL/TLS Library

Dependents:  

CyaSSL is SSL/TLS library for embedded systems.

wolfssl.com

Committer:
wolfSSL
Date:
Sun Apr 20 12:40:57 2014 +0000
Revision:
0:9d17e4342598
CyaSSL SSL/TLS Library 2.9.4;

Who changed what in which revision?

UserRevisionLine numberNew contents of line
wolfSSL 0:9d17e4342598 1 /* tfm.c
wolfSSL 0:9d17e4342598 2 *
wolfSSL 0:9d17e4342598 3 * Copyright (C) 2006-2013 wolfSSL Inc.
wolfSSL 0:9d17e4342598 4 *
wolfSSL 0:9d17e4342598 5 * This file is part of CyaSSL.
wolfSSL 0:9d17e4342598 6 *
wolfSSL 0:9d17e4342598 7 * CyaSSL is free software; you can redistribute it and/or modify
wolfSSL 0:9d17e4342598 8 * it under the terms of the GNU General Public License as published by
wolfSSL 0:9d17e4342598 9 * the Free Software Foundation; either version 2 of the License, or
wolfSSL 0:9d17e4342598 10 * (at your option) any later version.
wolfSSL 0:9d17e4342598 11 *
wolfSSL 0:9d17e4342598 12 * CyaSSL is distributed in the hope that it will be useful,
wolfSSL 0:9d17e4342598 13 * but WITHOUT ANY WARRANTY; without even the implied warranty of
wolfSSL 0:9d17e4342598 14 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
wolfSSL 0:9d17e4342598 15 * GNU General Public License for more details.
wolfSSL 0:9d17e4342598 16 *
wolfSSL 0:9d17e4342598 17 * You should have received a copy of the GNU General Public License
wolfSSL 0:9d17e4342598 18 * along with this program; if not, write to the Free Software
wolfSSL 0:9d17e4342598 19 * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA
wolfSSL 0:9d17e4342598 20 */
wolfSSL 0:9d17e4342598 21
wolfSSL 0:9d17e4342598 22
wolfSSL 0:9d17e4342598 23 /*
wolfSSL 0:9d17e4342598 24 * Based on public domain TomsFastMath 0.10 by Tom St Denis, tomstdenis@iahu.ca,
wolfSSL 0:9d17e4342598 25 * http://math.libtomcrypt.com
wolfSSL 0:9d17e4342598 26 */
wolfSSL 0:9d17e4342598 27
wolfSSL 0:9d17e4342598 28 /**
wolfSSL 0:9d17e4342598 29 * Edited by Moisés Guimarães (moisesguimaraesm@gmail.com)
wolfSSL 0:9d17e4342598 30 * to fit CyaSSL's needs.
wolfSSL 0:9d17e4342598 31 */
wolfSSL 0:9d17e4342598 32
wolfSSL 0:9d17e4342598 33 #ifdef HAVE_CONFIG_H
wolfSSL 0:9d17e4342598 34 #include <config.h>
wolfSSL 0:9d17e4342598 35 #endif
wolfSSL 0:9d17e4342598 36
wolfSSL 0:9d17e4342598 37 /* in case user set USE_FAST_MATH there */
wolfSSL 0:9d17e4342598 38 #include <cyassl/ctaocrypt/settings.h>
wolfSSL 0:9d17e4342598 39
wolfSSL 0:9d17e4342598 40 #ifdef USE_FAST_MATH
wolfSSL 0:9d17e4342598 41
wolfSSL 0:9d17e4342598 42 #include <cyassl/ctaocrypt/tfm.h>
wolfSSL 0:9d17e4342598 43 #include <ctaocrypt/src/asm.c> /* will define asm MACROS or C ones */
wolfSSL 0:9d17e4342598 44
wolfSSL 0:9d17e4342598 45
wolfSSL 0:9d17e4342598 46 /* math settings check */
wolfSSL 0:9d17e4342598 47 word32 CheckRunTimeSettings(void)
wolfSSL 0:9d17e4342598 48 {
wolfSSL 0:9d17e4342598 49 return CTC_SETTINGS;
wolfSSL 0:9d17e4342598 50 }
wolfSSL 0:9d17e4342598 51
wolfSSL 0:9d17e4342598 52
wolfSSL 0:9d17e4342598 53 /* math settings size check */
wolfSSL 0:9d17e4342598 54 word32 CheckRunTimeFastMath(void)
wolfSSL 0:9d17e4342598 55 {
wolfSSL 0:9d17e4342598 56 return FP_SIZE;
wolfSSL 0:9d17e4342598 57 }
wolfSSL 0:9d17e4342598 58
wolfSSL 0:9d17e4342598 59
wolfSSL 0:9d17e4342598 60 /* Functions */
wolfSSL 0:9d17e4342598 61
wolfSSL 0:9d17e4342598 62 void fp_add(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 63 {
wolfSSL 0:9d17e4342598 64 int sa, sb;
wolfSSL 0:9d17e4342598 65
wolfSSL 0:9d17e4342598 66 /* get sign of both inputs */
wolfSSL 0:9d17e4342598 67 sa = a->sign;
wolfSSL 0:9d17e4342598 68 sb = b->sign;
wolfSSL 0:9d17e4342598 69
wolfSSL 0:9d17e4342598 70 /* handle two cases, not four */
wolfSSL 0:9d17e4342598 71 if (sa == sb) {
wolfSSL 0:9d17e4342598 72 /* both positive or both negative */
wolfSSL 0:9d17e4342598 73 /* add their magnitudes, copy the sign */
wolfSSL 0:9d17e4342598 74 c->sign = sa;
wolfSSL 0:9d17e4342598 75 s_fp_add (a, b, c);
wolfSSL 0:9d17e4342598 76 } else {
wolfSSL 0:9d17e4342598 77 /* one positive, the other negative */
wolfSSL 0:9d17e4342598 78 /* subtract the one with the greater magnitude from */
wolfSSL 0:9d17e4342598 79 /* the one of the lesser magnitude. The result gets */
wolfSSL 0:9d17e4342598 80 /* the sign of the one with the greater magnitude. */
wolfSSL 0:9d17e4342598 81 if (fp_cmp_mag (a, b) == FP_LT) {
wolfSSL 0:9d17e4342598 82 c->sign = sb;
wolfSSL 0:9d17e4342598 83 s_fp_sub (b, a, c);
wolfSSL 0:9d17e4342598 84 } else {
wolfSSL 0:9d17e4342598 85 c->sign = sa;
wolfSSL 0:9d17e4342598 86 s_fp_sub (a, b, c);
wolfSSL 0:9d17e4342598 87 }
wolfSSL 0:9d17e4342598 88 }
wolfSSL 0:9d17e4342598 89 }
wolfSSL 0:9d17e4342598 90
wolfSSL 0:9d17e4342598 91 /* unsigned addition */
wolfSSL 0:9d17e4342598 92 void s_fp_add(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 93 {
wolfSSL 0:9d17e4342598 94 int x, y, oldused;
wolfSSL 0:9d17e4342598 95 register fp_word t;
wolfSSL 0:9d17e4342598 96
wolfSSL 0:9d17e4342598 97 y = MAX(a->used, b->used);
wolfSSL 0:9d17e4342598 98 oldused = c->used;
wolfSSL 0:9d17e4342598 99 c->used = y;
wolfSSL 0:9d17e4342598 100
wolfSSL 0:9d17e4342598 101 t = 0;
wolfSSL 0:9d17e4342598 102 for (x = 0; x < y; x++) {
wolfSSL 0:9d17e4342598 103 t += ((fp_word)a->dp[x]) + ((fp_word)b->dp[x]);
wolfSSL 0:9d17e4342598 104 c->dp[x] = (fp_digit)t;
wolfSSL 0:9d17e4342598 105 t >>= DIGIT_BIT;
wolfSSL 0:9d17e4342598 106 }
wolfSSL 0:9d17e4342598 107 if (t != 0 && x < FP_SIZE) {
wolfSSL 0:9d17e4342598 108 c->dp[c->used++] = (fp_digit)t;
wolfSSL 0:9d17e4342598 109 ++x;
wolfSSL 0:9d17e4342598 110 }
wolfSSL 0:9d17e4342598 111
wolfSSL 0:9d17e4342598 112 c->used = x;
wolfSSL 0:9d17e4342598 113 for (; x < oldused; x++) {
wolfSSL 0:9d17e4342598 114 c->dp[x] = 0;
wolfSSL 0:9d17e4342598 115 }
wolfSSL 0:9d17e4342598 116 fp_clamp(c);
wolfSSL 0:9d17e4342598 117 }
wolfSSL 0:9d17e4342598 118
wolfSSL 0:9d17e4342598 119 /* c = a - b */
wolfSSL 0:9d17e4342598 120 void fp_sub(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 121 {
wolfSSL 0:9d17e4342598 122 int sa, sb;
wolfSSL 0:9d17e4342598 123
wolfSSL 0:9d17e4342598 124 sa = a->sign;
wolfSSL 0:9d17e4342598 125 sb = b->sign;
wolfSSL 0:9d17e4342598 126
wolfSSL 0:9d17e4342598 127 if (sa != sb) {
wolfSSL 0:9d17e4342598 128 /* subtract a negative from a positive, OR */
wolfSSL 0:9d17e4342598 129 /* subtract a positive from a negative. */
wolfSSL 0:9d17e4342598 130 /* In either case, ADD their magnitudes, */
wolfSSL 0:9d17e4342598 131 /* and use the sign of the first number. */
wolfSSL 0:9d17e4342598 132 c->sign = sa;
wolfSSL 0:9d17e4342598 133 s_fp_add (a, b, c);
wolfSSL 0:9d17e4342598 134 } else {
wolfSSL 0:9d17e4342598 135 /* subtract a positive from a positive, OR */
wolfSSL 0:9d17e4342598 136 /* subtract a negative from a negative. */
wolfSSL 0:9d17e4342598 137 /* First, take the difference between their */
wolfSSL 0:9d17e4342598 138 /* magnitudes, then... */
wolfSSL 0:9d17e4342598 139 if (fp_cmp_mag (a, b) != FP_LT) {
wolfSSL 0:9d17e4342598 140 /* Copy the sign from the first */
wolfSSL 0:9d17e4342598 141 c->sign = sa;
wolfSSL 0:9d17e4342598 142 /* The first has a larger or equal magnitude */
wolfSSL 0:9d17e4342598 143 s_fp_sub (a, b, c);
wolfSSL 0:9d17e4342598 144 } else {
wolfSSL 0:9d17e4342598 145 /* The result has the *opposite* sign from */
wolfSSL 0:9d17e4342598 146 /* the first number. */
wolfSSL 0:9d17e4342598 147 c->sign = (sa == FP_ZPOS) ? FP_NEG : FP_ZPOS;
wolfSSL 0:9d17e4342598 148 /* The second has a larger magnitude */
wolfSSL 0:9d17e4342598 149 s_fp_sub (b, a, c);
wolfSSL 0:9d17e4342598 150 }
wolfSSL 0:9d17e4342598 151 }
wolfSSL 0:9d17e4342598 152 }
wolfSSL 0:9d17e4342598 153
wolfSSL 0:9d17e4342598 154 /* unsigned subtraction ||a|| >= ||b|| ALWAYS! */
wolfSSL 0:9d17e4342598 155 void s_fp_sub(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 156 {
wolfSSL 0:9d17e4342598 157 int x, oldbused, oldused;
wolfSSL 0:9d17e4342598 158 fp_word t;
wolfSSL 0:9d17e4342598 159
wolfSSL 0:9d17e4342598 160 oldused = c->used;
wolfSSL 0:9d17e4342598 161 oldbused = b->used;
wolfSSL 0:9d17e4342598 162 c->used = a->used;
wolfSSL 0:9d17e4342598 163 t = 0;
wolfSSL 0:9d17e4342598 164 for (x = 0; x < oldbused; x++) {
wolfSSL 0:9d17e4342598 165 t = ((fp_word)a->dp[x]) - (((fp_word)b->dp[x]) + t);
wolfSSL 0:9d17e4342598 166 c->dp[x] = (fp_digit)t;
wolfSSL 0:9d17e4342598 167 t = (t >> DIGIT_BIT)&1;
wolfSSL 0:9d17e4342598 168 }
wolfSSL 0:9d17e4342598 169 for (; x < a->used; x++) {
wolfSSL 0:9d17e4342598 170 t = ((fp_word)a->dp[x]) - t;
wolfSSL 0:9d17e4342598 171 c->dp[x] = (fp_digit)t;
wolfSSL 0:9d17e4342598 172 t = (t >> DIGIT_BIT)&1;
wolfSSL 0:9d17e4342598 173 }
wolfSSL 0:9d17e4342598 174 for (; x < oldused; x++) {
wolfSSL 0:9d17e4342598 175 c->dp[x] = 0;
wolfSSL 0:9d17e4342598 176 }
wolfSSL 0:9d17e4342598 177 fp_clamp(c);
wolfSSL 0:9d17e4342598 178 }
wolfSSL 0:9d17e4342598 179
wolfSSL 0:9d17e4342598 180 /* c = a * b */
wolfSSL 0:9d17e4342598 181 void fp_mul(fp_int *A, fp_int *B, fp_int *C)
wolfSSL 0:9d17e4342598 182 {
wolfSSL 0:9d17e4342598 183 int y, yy;
wolfSSL 0:9d17e4342598 184
wolfSSL 0:9d17e4342598 185 y = MAX(A->used, B->used);
wolfSSL 0:9d17e4342598 186 yy = MIN(A->used, B->used);
wolfSSL 0:9d17e4342598 187
wolfSSL 0:9d17e4342598 188 /* call generic if we're out of range */
wolfSSL 0:9d17e4342598 189 if (y + yy > FP_SIZE) {
wolfSSL 0:9d17e4342598 190 fp_mul_comba(A, B, C);
wolfSSL 0:9d17e4342598 191 return ;
wolfSSL 0:9d17e4342598 192 }
wolfSSL 0:9d17e4342598 193
wolfSSL 0:9d17e4342598 194 /* pick a comba (unrolled 4/8/16/32 x or rolled) based on the size
wolfSSL 0:9d17e4342598 195 of the largest input. We also want to avoid doing excess mults if the
wolfSSL 0:9d17e4342598 196 inputs are not close to the next power of two. That is, for example,
wolfSSL 0:9d17e4342598 197 if say y=17 then we would do (32-17)^2 = 225 unneeded multiplications
wolfSSL 0:9d17e4342598 198 */
wolfSSL 0:9d17e4342598 199
wolfSSL 0:9d17e4342598 200 #ifdef TFM_MUL3
wolfSSL 0:9d17e4342598 201 if (y <= 3) {
wolfSSL 0:9d17e4342598 202 fp_mul_comba3(A,B,C);
wolfSSL 0:9d17e4342598 203 return;
wolfSSL 0:9d17e4342598 204 }
wolfSSL 0:9d17e4342598 205 #endif
wolfSSL 0:9d17e4342598 206 #ifdef TFM_MUL4
wolfSSL 0:9d17e4342598 207 if (y == 4) {
wolfSSL 0:9d17e4342598 208 fp_mul_comba4(A,B,C);
wolfSSL 0:9d17e4342598 209 return;
wolfSSL 0:9d17e4342598 210 }
wolfSSL 0:9d17e4342598 211 #endif
wolfSSL 0:9d17e4342598 212 #ifdef TFM_MUL6
wolfSSL 0:9d17e4342598 213 if (y <= 6) {
wolfSSL 0:9d17e4342598 214 fp_mul_comba6(A,B,C);
wolfSSL 0:9d17e4342598 215 return;
wolfSSL 0:9d17e4342598 216 }
wolfSSL 0:9d17e4342598 217 #endif
wolfSSL 0:9d17e4342598 218 #ifdef TFM_MUL7
wolfSSL 0:9d17e4342598 219 if (y == 7) {
wolfSSL 0:9d17e4342598 220 fp_mul_comba7(A,B,C);
wolfSSL 0:9d17e4342598 221 return;
wolfSSL 0:9d17e4342598 222 }
wolfSSL 0:9d17e4342598 223 #endif
wolfSSL 0:9d17e4342598 224 #ifdef TFM_MUL8
wolfSSL 0:9d17e4342598 225 if (y == 8) {
wolfSSL 0:9d17e4342598 226 fp_mul_comba8(A,B,C);
wolfSSL 0:9d17e4342598 227 return;
wolfSSL 0:9d17e4342598 228 }
wolfSSL 0:9d17e4342598 229 #endif
wolfSSL 0:9d17e4342598 230 #ifdef TFM_MUL9
wolfSSL 0:9d17e4342598 231 if (y == 9) {
wolfSSL 0:9d17e4342598 232 fp_mul_comba9(A,B,C);
wolfSSL 0:9d17e4342598 233 return;
wolfSSL 0:9d17e4342598 234 }
wolfSSL 0:9d17e4342598 235 #endif
wolfSSL 0:9d17e4342598 236 #ifdef TFM_MUL12
wolfSSL 0:9d17e4342598 237 if (y <= 12) {
wolfSSL 0:9d17e4342598 238 fp_mul_comba12(A,B,C);
wolfSSL 0:9d17e4342598 239 return;
wolfSSL 0:9d17e4342598 240 }
wolfSSL 0:9d17e4342598 241 #endif
wolfSSL 0:9d17e4342598 242 #ifdef TFM_MUL17
wolfSSL 0:9d17e4342598 243 if (y <= 17) {
wolfSSL 0:9d17e4342598 244 fp_mul_comba17(A,B,C);
wolfSSL 0:9d17e4342598 245 return;
wolfSSL 0:9d17e4342598 246 }
wolfSSL 0:9d17e4342598 247 #endif
wolfSSL 0:9d17e4342598 248
wolfSSL 0:9d17e4342598 249 #ifdef TFM_SMALL_SET
wolfSSL 0:9d17e4342598 250 if (y <= 16) {
wolfSSL 0:9d17e4342598 251 fp_mul_comba_small(A,B,C);
wolfSSL 0:9d17e4342598 252 return;
wolfSSL 0:9d17e4342598 253 }
wolfSSL 0:9d17e4342598 254 #endif
wolfSSL 0:9d17e4342598 255 #if defined(TFM_MUL20)
wolfSSL 0:9d17e4342598 256 if (y <= 20) {
wolfSSL 0:9d17e4342598 257 fp_mul_comba20(A,B,C);
wolfSSL 0:9d17e4342598 258 return;
wolfSSL 0:9d17e4342598 259 }
wolfSSL 0:9d17e4342598 260 #endif
wolfSSL 0:9d17e4342598 261 #if defined(TFM_MUL24)
wolfSSL 0:9d17e4342598 262 if (yy >= 16 && y <= 24) {
wolfSSL 0:9d17e4342598 263 fp_mul_comba24(A,B,C);
wolfSSL 0:9d17e4342598 264 return;
wolfSSL 0:9d17e4342598 265 }
wolfSSL 0:9d17e4342598 266 #endif
wolfSSL 0:9d17e4342598 267 #if defined(TFM_MUL28)
wolfSSL 0:9d17e4342598 268 if (yy >= 20 && y <= 28) {
wolfSSL 0:9d17e4342598 269 fp_mul_comba28(A,B,C);
wolfSSL 0:9d17e4342598 270 return;
wolfSSL 0:9d17e4342598 271 }
wolfSSL 0:9d17e4342598 272 #endif
wolfSSL 0:9d17e4342598 273 #if defined(TFM_MUL32)
wolfSSL 0:9d17e4342598 274 if (yy >= 24 && y <= 32) {
wolfSSL 0:9d17e4342598 275 fp_mul_comba32(A,B,C);
wolfSSL 0:9d17e4342598 276 return;
wolfSSL 0:9d17e4342598 277 }
wolfSSL 0:9d17e4342598 278 #endif
wolfSSL 0:9d17e4342598 279 #if defined(TFM_MUL48)
wolfSSL 0:9d17e4342598 280 if (yy >= 40 && y <= 48) {
wolfSSL 0:9d17e4342598 281 fp_mul_comba48(A,B,C);
wolfSSL 0:9d17e4342598 282 return;
wolfSSL 0:9d17e4342598 283 }
wolfSSL 0:9d17e4342598 284 #endif
wolfSSL 0:9d17e4342598 285 #if defined(TFM_MUL64)
wolfSSL 0:9d17e4342598 286 if (yy >= 56 && y <= 64) {
wolfSSL 0:9d17e4342598 287 fp_mul_comba64(A,B,C);
wolfSSL 0:9d17e4342598 288 return;
wolfSSL 0:9d17e4342598 289 }
wolfSSL 0:9d17e4342598 290 #endif
wolfSSL 0:9d17e4342598 291 fp_mul_comba(A,B,C);
wolfSSL 0:9d17e4342598 292 }
wolfSSL 0:9d17e4342598 293
wolfSSL 0:9d17e4342598 294 void fp_mul_2(fp_int * a, fp_int * b)
wolfSSL 0:9d17e4342598 295 {
wolfSSL 0:9d17e4342598 296 int x, oldused;
wolfSSL 0:9d17e4342598 297
wolfSSL 0:9d17e4342598 298 oldused = b->used;
wolfSSL 0:9d17e4342598 299 b->used = a->used;
wolfSSL 0:9d17e4342598 300
wolfSSL 0:9d17e4342598 301 {
wolfSSL 0:9d17e4342598 302 register fp_digit r, rr, *tmpa, *tmpb;
wolfSSL 0:9d17e4342598 303
wolfSSL 0:9d17e4342598 304 /* alias for source */
wolfSSL 0:9d17e4342598 305 tmpa = a->dp;
wolfSSL 0:9d17e4342598 306
wolfSSL 0:9d17e4342598 307 /* alias for dest */
wolfSSL 0:9d17e4342598 308 tmpb = b->dp;
wolfSSL 0:9d17e4342598 309
wolfSSL 0:9d17e4342598 310 /* carry */
wolfSSL 0:9d17e4342598 311 r = 0;
wolfSSL 0:9d17e4342598 312 for (x = 0; x < a->used; x++) {
wolfSSL 0:9d17e4342598 313
wolfSSL 0:9d17e4342598 314 /* get what will be the *next* carry bit from the
wolfSSL 0:9d17e4342598 315 * MSB of the current digit
wolfSSL 0:9d17e4342598 316 */
wolfSSL 0:9d17e4342598 317 rr = *tmpa >> ((fp_digit)(DIGIT_BIT - 1));
wolfSSL 0:9d17e4342598 318
wolfSSL 0:9d17e4342598 319 /* now shift up this digit, add in the carry [from the previous] */
wolfSSL 0:9d17e4342598 320 *tmpb++ = ((*tmpa++ << ((fp_digit)1)) | r);
wolfSSL 0:9d17e4342598 321
wolfSSL 0:9d17e4342598 322 /* copy the carry that would be from the source
wolfSSL 0:9d17e4342598 323 * digit into the next iteration
wolfSSL 0:9d17e4342598 324 */
wolfSSL 0:9d17e4342598 325 r = rr;
wolfSSL 0:9d17e4342598 326 }
wolfSSL 0:9d17e4342598 327
wolfSSL 0:9d17e4342598 328 /* new leading digit? */
wolfSSL 0:9d17e4342598 329 if (r != 0 && b->used != (FP_SIZE-1)) {
wolfSSL 0:9d17e4342598 330 /* add a MSB which is always 1 at this point */
wolfSSL 0:9d17e4342598 331 *tmpb = 1;
wolfSSL 0:9d17e4342598 332 ++(b->used);
wolfSSL 0:9d17e4342598 333 }
wolfSSL 0:9d17e4342598 334
wolfSSL 0:9d17e4342598 335 /* now zero any excess digits on the destination
wolfSSL 0:9d17e4342598 336 * that we didn't write to
wolfSSL 0:9d17e4342598 337 */
wolfSSL 0:9d17e4342598 338 tmpb = b->dp + b->used;
wolfSSL 0:9d17e4342598 339 for (x = b->used; x < oldused; x++) {
wolfSSL 0:9d17e4342598 340 *tmpb++ = 0;
wolfSSL 0:9d17e4342598 341 }
wolfSSL 0:9d17e4342598 342 }
wolfSSL 0:9d17e4342598 343 b->sign = a->sign;
wolfSSL 0:9d17e4342598 344 }
wolfSSL 0:9d17e4342598 345
wolfSSL 0:9d17e4342598 346 /* c = a * b */
wolfSSL 0:9d17e4342598 347 void fp_mul_d(fp_int *a, fp_digit b, fp_int *c)
wolfSSL 0:9d17e4342598 348 {
wolfSSL 0:9d17e4342598 349 fp_word w;
wolfSSL 0:9d17e4342598 350 int x, oldused;
wolfSSL 0:9d17e4342598 351
wolfSSL 0:9d17e4342598 352 oldused = c->used;
wolfSSL 0:9d17e4342598 353 c->used = a->used;
wolfSSL 0:9d17e4342598 354 c->sign = a->sign;
wolfSSL 0:9d17e4342598 355 w = 0;
wolfSSL 0:9d17e4342598 356 for (x = 0; x < a->used; x++) {
wolfSSL 0:9d17e4342598 357 w = ((fp_word)a->dp[x]) * ((fp_word)b) + w;
wolfSSL 0:9d17e4342598 358 c->dp[x] = (fp_digit)w;
wolfSSL 0:9d17e4342598 359 w = w >> DIGIT_BIT;
wolfSSL 0:9d17e4342598 360 }
wolfSSL 0:9d17e4342598 361 if (w != 0 && (a->used != FP_SIZE)) {
wolfSSL 0:9d17e4342598 362 c->dp[c->used++] = (fp_digit) w;
wolfSSL 0:9d17e4342598 363 ++x;
wolfSSL 0:9d17e4342598 364 }
wolfSSL 0:9d17e4342598 365 for (; x < oldused; x++) {
wolfSSL 0:9d17e4342598 366 c->dp[x] = 0;
wolfSSL 0:9d17e4342598 367 }
wolfSSL 0:9d17e4342598 368 fp_clamp(c);
wolfSSL 0:9d17e4342598 369 }
wolfSSL 0:9d17e4342598 370
wolfSSL 0:9d17e4342598 371 /* c = a * 2**d */
wolfSSL 0:9d17e4342598 372 void fp_mul_2d(fp_int *a, int b, fp_int *c)
wolfSSL 0:9d17e4342598 373 {
wolfSSL 0:9d17e4342598 374 fp_digit carry, carrytmp, shift;
wolfSSL 0:9d17e4342598 375 int x;
wolfSSL 0:9d17e4342598 376
wolfSSL 0:9d17e4342598 377 /* copy it */
wolfSSL 0:9d17e4342598 378 fp_copy(a, c);
wolfSSL 0:9d17e4342598 379
wolfSSL 0:9d17e4342598 380 /* handle whole digits */
wolfSSL 0:9d17e4342598 381 if (b >= DIGIT_BIT) {
wolfSSL 0:9d17e4342598 382 fp_lshd(c, b/DIGIT_BIT);
wolfSSL 0:9d17e4342598 383 }
wolfSSL 0:9d17e4342598 384 b %= DIGIT_BIT;
wolfSSL 0:9d17e4342598 385
wolfSSL 0:9d17e4342598 386 /* shift the digits */
wolfSSL 0:9d17e4342598 387 if (b != 0) {
wolfSSL 0:9d17e4342598 388 carry = 0;
wolfSSL 0:9d17e4342598 389 shift = DIGIT_BIT - b;
wolfSSL 0:9d17e4342598 390 for (x = 0; x < c->used; x++) {
wolfSSL 0:9d17e4342598 391 carrytmp = c->dp[x] >> shift;
wolfSSL 0:9d17e4342598 392 c->dp[x] = (c->dp[x] << b) + carry;
wolfSSL 0:9d17e4342598 393 carry = carrytmp;
wolfSSL 0:9d17e4342598 394 }
wolfSSL 0:9d17e4342598 395 /* store last carry if room */
wolfSSL 0:9d17e4342598 396 if (carry && x < FP_SIZE) {
wolfSSL 0:9d17e4342598 397 c->dp[c->used++] = carry;
wolfSSL 0:9d17e4342598 398 }
wolfSSL 0:9d17e4342598 399 }
wolfSSL 0:9d17e4342598 400 fp_clamp(c);
wolfSSL 0:9d17e4342598 401 }
wolfSSL 0:9d17e4342598 402
wolfSSL 0:9d17e4342598 403 /* generic PxQ multiplier */
wolfSSL 0:9d17e4342598 404 void fp_mul_comba(fp_int *A, fp_int *B, fp_int *C)
wolfSSL 0:9d17e4342598 405 {
wolfSSL 0:9d17e4342598 406 int ix, iy, iz, tx, ty, pa;
wolfSSL 0:9d17e4342598 407 fp_digit c0, c1, c2, *tmpx, *tmpy;
wolfSSL 0:9d17e4342598 408 fp_int tmp, *dst;
wolfSSL 0:9d17e4342598 409
wolfSSL 0:9d17e4342598 410 COMBA_START;
wolfSSL 0:9d17e4342598 411 COMBA_CLEAR;
wolfSSL 0:9d17e4342598 412
wolfSSL 0:9d17e4342598 413 /* get size of output and trim */
wolfSSL 0:9d17e4342598 414 pa = A->used + B->used;
wolfSSL 0:9d17e4342598 415 if (pa >= FP_SIZE) {
wolfSSL 0:9d17e4342598 416 pa = FP_SIZE-1;
wolfSSL 0:9d17e4342598 417 }
wolfSSL 0:9d17e4342598 418
wolfSSL 0:9d17e4342598 419 if (A == C || B == C) {
wolfSSL 0:9d17e4342598 420 fp_zero(&tmp);
wolfSSL 0:9d17e4342598 421 dst = &tmp;
wolfSSL 0:9d17e4342598 422 } else {
wolfSSL 0:9d17e4342598 423 fp_zero(C);
wolfSSL 0:9d17e4342598 424 dst = C;
wolfSSL 0:9d17e4342598 425 }
wolfSSL 0:9d17e4342598 426
wolfSSL 0:9d17e4342598 427 for (ix = 0; ix < pa; ix++) {
wolfSSL 0:9d17e4342598 428 /* get offsets into the two bignums */
wolfSSL 0:9d17e4342598 429 ty = MIN(ix, B->used-1);
wolfSSL 0:9d17e4342598 430 tx = ix - ty;
wolfSSL 0:9d17e4342598 431
wolfSSL 0:9d17e4342598 432 /* setup temp aliases */
wolfSSL 0:9d17e4342598 433 tmpx = A->dp + tx;
wolfSSL 0:9d17e4342598 434 tmpy = B->dp + ty;
wolfSSL 0:9d17e4342598 435
wolfSSL 0:9d17e4342598 436 /* this is the number of times the loop will iterrate, essentially its
wolfSSL 0:9d17e4342598 437 while (tx++ < a->used && ty-- >= 0) { ... }
wolfSSL 0:9d17e4342598 438 */
wolfSSL 0:9d17e4342598 439 iy = MIN(A->used-tx, ty+1);
wolfSSL 0:9d17e4342598 440
wolfSSL 0:9d17e4342598 441 /* execute loop */
wolfSSL 0:9d17e4342598 442 COMBA_FORWARD;
wolfSSL 0:9d17e4342598 443 for (iz = 0; iz < iy; ++iz) {
wolfSSL 0:9d17e4342598 444 /* TAO change COMBA_ADD back to MULADD */
wolfSSL 0:9d17e4342598 445 MULADD(*tmpx++, *tmpy--);
wolfSSL 0:9d17e4342598 446 }
wolfSSL 0:9d17e4342598 447
wolfSSL 0:9d17e4342598 448 /* store term */
wolfSSL 0:9d17e4342598 449 COMBA_STORE(dst->dp[ix]);
wolfSSL 0:9d17e4342598 450 }
wolfSSL 0:9d17e4342598 451 COMBA_FINI;
wolfSSL 0:9d17e4342598 452
wolfSSL 0:9d17e4342598 453 dst->used = pa;
wolfSSL 0:9d17e4342598 454 dst->sign = A->sign ^ B->sign;
wolfSSL 0:9d17e4342598 455 fp_clamp(dst);
wolfSSL 0:9d17e4342598 456 fp_copy(dst, C);
wolfSSL 0:9d17e4342598 457 }
wolfSSL 0:9d17e4342598 458
wolfSSL 0:9d17e4342598 459 /* a/b => cb + d == a */
wolfSSL 0:9d17e4342598 460 int fp_div(fp_int *a, fp_int *b, fp_int *c, fp_int *d)
wolfSSL 0:9d17e4342598 461 {
wolfSSL 0:9d17e4342598 462 fp_int q, x, y, t1, t2;
wolfSSL 0:9d17e4342598 463 int n, t, i, norm, neg;
wolfSSL 0:9d17e4342598 464
wolfSSL 0:9d17e4342598 465 /* is divisor zero ? */
wolfSSL 0:9d17e4342598 466 if (fp_iszero (b) == 1) {
wolfSSL 0:9d17e4342598 467 return FP_VAL;
wolfSSL 0:9d17e4342598 468 }
wolfSSL 0:9d17e4342598 469
wolfSSL 0:9d17e4342598 470 /* if a < b then q=0, r = a */
wolfSSL 0:9d17e4342598 471 if (fp_cmp_mag (a, b) == FP_LT) {
wolfSSL 0:9d17e4342598 472 if (d != NULL) {
wolfSSL 0:9d17e4342598 473 fp_copy (a, d);
wolfSSL 0:9d17e4342598 474 }
wolfSSL 0:9d17e4342598 475 if (c != NULL) {
wolfSSL 0:9d17e4342598 476 fp_zero (c);
wolfSSL 0:9d17e4342598 477 }
wolfSSL 0:9d17e4342598 478 return FP_OKAY;
wolfSSL 0:9d17e4342598 479 }
wolfSSL 0:9d17e4342598 480
wolfSSL 0:9d17e4342598 481 fp_init(&q);
wolfSSL 0:9d17e4342598 482 q.used = a->used + 2;
wolfSSL 0:9d17e4342598 483
wolfSSL 0:9d17e4342598 484 fp_init(&t1);
wolfSSL 0:9d17e4342598 485 fp_init(&t2);
wolfSSL 0:9d17e4342598 486 fp_init_copy(&x, a);
wolfSSL 0:9d17e4342598 487 fp_init_copy(&y, b);
wolfSSL 0:9d17e4342598 488
wolfSSL 0:9d17e4342598 489 /* fix the sign */
wolfSSL 0:9d17e4342598 490 neg = (a->sign == b->sign) ? FP_ZPOS : FP_NEG;
wolfSSL 0:9d17e4342598 491 x.sign = y.sign = FP_ZPOS;
wolfSSL 0:9d17e4342598 492
wolfSSL 0:9d17e4342598 493 /* normalize both x and y, ensure that y >= b/2, [b == 2**DIGIT_BIT] */
wolfSSL 0:9d17e4342598 494 norm = fp_count_bits(&y) % DIGIT_BIT;
wolfSSL 0:9d17e4342598 495 if (norm < (int)(DIGIT_BIT-1)) {
wolfSSL 0:9d17e4342598 496 norm = (DIGIT_BIT-1) - norm;
wolfSSL 0:9d17e4342598 497 fp_mul_2d (&x, norm, &x);
wolfSSL 0:9d17e4342598 498 fp_mul_2d (&y, norm, &y);
wolfSSL 0:9d17e4342598 499 } else {
wolfSSL 0:9d17e4342598 500 norm = 0;
wolfSSL 0:9d17e4342598 501 }
wolfSSL 0:9d17e4342598 502
wolfSSL 0:9d17e4342598 503 /* note hac does 0 based, so if used==5 then its 0,1,2,3,4, e.g. use 4 */
wolfSSL 0:9d17e4342598 504 n = x.used - 1;
wolfSSL 0:9d17e4342598 505 t = y.used - 1;
wolfSSL 0:9d17e4342598 506
wolfSSL 0:9d17e4342598 507 /* while (x >= y*b**n-t) do { q[n-t] += 1; x -= y*b**{n-t} } */
wolfSSL 0:9d17e4342598 508 fp_lshd (&y, n - t); /* y = y*b**{n-t} */
wolfSSL 0:9d17e4342598 509
wolfSSL 0:9d17e4342598 510 while (fp_cmp (&x, &y) != FP_LT) {
wolfSSL 0:9d17e4342598 511 ++(q.dp[n - t]);
wolfSSL 0:9d17e4342598 512 fp_sub (&x, &y, &x);
wolfSSL 0:9d17e4342598 513 }
wolfSSL 0:9d17e4342598 514
wolfSSL 0:9d17e4342598 515 /* reset y by shifting it back down */
wolfSSL 0:9d17e4342598 516 fp_rshd (&y, n - t);
wolfSSL 0:9d17e4342598 517
wolfSSL 0:9d17e4342598 518 /* step 3. for i from n down to (t + 1) */
wolfSSL 0:9d17e4342598 519 for (i = n; i >= (t + 1); i--) {
wolfSSL 0:9d17e4342598 520 if (i > x.used) {
wolfSSL 0:9d17e4342598 521 continue;
wolfSSL 0:9d17e4342598 522 }
wolfSSL 0:9d17e4342598 523
wolfSSL 0:9d17e4342598 524 /* step 3.1 if xi == yt then set q{i-t-1} to b-1,
wolfSSL 0:9d17e4342598 525 * otherwise set q{i-t-1} to (xi*b + x{i-1})/yt */
wolfSSL 0:9d17e4342598 526 if (x.dp[i] == y.dp[t]) {
wolfSSL 0:9d17e4342598 527 q.dp[i - t - 1] = (fp_digit) ((((fp_word)1) << DIGIT_BIT) - 1);
wolfSSL 0:9d17e4342598 528 } else {
wolfSSL 0:9d17e4342598 529 fp_word tmp;
wolfSSL 0:9d17e4342598 530 tmp = ((fp_word) x.dp[i]) << ((fp_word) DIGIT_BIT);
wolfSSL 0:9d17e4342598 531 tmp |= ((fp_word) x.dp[i - 1]);
wolfSSL 0:9d17e4342598 532 tmp /= ((fp_word)y.dp[t]);
wolfSSL 0:9d17e4342598 533 q.dp[i - t - 1] = (fp_digit) (tmp);
wolfSSL 0:9d17e4342598 534 }
wolfSSL 0:9d17e4342598 535
wolfSSL 0:9d17e4342598 536 /* while (q{i-t-1} * (yt * b + y{t-1})) >
wolfSSL 0:9d17e4342598 537 xi * b**2 + xi-1 * b + xi-2
wolfSSL 0:9d17e4342598 538
wolfSSL 0:9d17e4342598 539 do q{i-t-1} -= 1;
wolfSSL 0:9d17e4342598 540 */
wolfSSL 0:9d17e4342598 541 q.dp[i - t - 1] = (q.dp[i - t - 1] + 1);
wolfSSL 0:9d17e4342598 542 do {
wolfSSL 0:9d17e4342598 543 q.dp[i - t - 1] = (q.dp[i - t - 1] - 1);
wolfSSL 0:9d17e4342598 544
wolfSSL 0:9d17e4342598 545 /* find left hand */
wolfSSL 0:9d17e4342598 546 fp_zero (&t1);
wolfSSL 0:9d17e4342598 547 t1.dp[0] = (t - 1 < 0) ? 0 : y.dp[t - 1];
wolfSSL 0:9d17e4342598 548 t1.dp[1] = y.dp[t];
wolfSSL 0:9d17e4342598 549 t1.used = 2;
wolfSSL 0:9d17e4342598 550 fp_mul_d (&t1, q.dp[i - t - 1], &t1);
wolfSSL 0:9d17e4342598 551
wolfSSL 0:9d17e4342598 552 /* find right hand */
wolfSSL 0:9d17e4342598 553 t2.dp[0] = (i - 2 < 0) ? 0 : x.dp[i - 2];
wolfSSL 0:9d17e4342598 554 t2.dp[1] = (i - 1 < 0) ? 0 : x.dp[i - 1];
wolfSSL 0:9d17e4342598 555 t2.dp[2] = x.dp[i];
wolfSSL 0:9d17e4342598 556 t2.used = 3;
wolfSSL 0:9d17e4342598 557 } while (fp_cmp_mag(&t1, &t2) == FP_GT);
wolfSSL 0:9d17e4342598 558
wolfSSL 0:9d17e4342598 559 /* step 3.3 x = x - q{i-t-1} * y * b**{i-t-1} */
wolfSSL 0:9d17e4342598 560 fp_mul_d (&y, q.dp[i - t - 1], &t1);
wolfSSL 0:9d17e4342598 561 fp_lshd (&t1, i - t - 1);
wolfSSL 0:9d17e4342598 562 fp_sub (&x, &t1, &x);
wolfSSL 0:9d17e4342598 563
wolfSSL 0:9d17e4342598 564 /* if x < 0 then { x = x + y*b**{i-t-1}; q{i-t-1} -= 1; } */
wolfSSL 0:9d17e4342598 565 if (x.sign == FP_NEG) {
wolfSSL 0:9d17e4342598 566 fp_copy (&y, &t1);
wolfSSL 0:9d17e4342598 567 fp_lshd (&t1, i - t - 1);
wolfSSL 0:9d17e4342598 568 fp_add (&x, &t1, &x);
wolfSSL 0:9d17e4342598 569 q.dp[i - t - 1] = q.dp[i - t - 1] - 1;
wolfSSL 0:9d17e4342598 570 }
wolfSSL 0:9d17e4342598 571 }
wolfSSL 0:9d17e4342598 572
wolfSSL 0:9d17e4342598 573 /* now q is the quotient and x is the remainder
wolfSSL 0:9d17e4342598 574 * [which we have to normalize]
wolfSSL 0:9d17e4342598 575 */
wolfSSL 0:9d17e4342598 576
wolfSSL 0:9d17e4342598 577 /* get sign before writing to c */
wolfSSL 0:9d17e4342598 578 x.sign = x.used == 0 ? FP_ZPOS : a->sign;
wolfSSL 0:9d17e4342598 579
wolfSSL 0:9d17e4342598 580 if (c != NULL) {
wolfSSL 0:9d17e4342598 581 fp_clamp (&q);
wolfSSL 0:9d17e4342598 582 fp_copy (&q, c);
wolfSSL 0:9d17e4342598 583 c->sign = neg;
wolfSSL 0:9d17e4342598 584 }
wolfSSL 0:9d17e4342598 585
wolfSSL 0:9d17e4342598 586 if (d != NULL) {
wolfSSL 0:9d17e4342598 587 fp_div_2d (&x, norm, &x, NULL);
wolfSSL 0:9d17e4342598 588
wolfSSL 0:9d17e4342598 589 /* the following is a kludge, essentially we were seeing the right remainder but
wolfSSL 0:9d17e4342598 590 with excess digits that should have been zero
wolfSSL 0:9d17e4342598 591 */
wolfSSL 0:9d17e4342598 592 for (i = b->used; i < x.used; i++) {
wolfSSL 0:9d17e4342598 593 x.dp[i] = 0;
wolfSSL 0:9d17e4342598 594 }
wolfSSL 0:9d17e4342598 595 fp_clamp(&x);
wolfSSL 0:9d17e4342598 596 fp_copy (&x, d);
wolfSSL 0:9d17e4342598 597 }
wolfSSL 0:9d17e4342598 598
wolfSSL 0:9d17e4342598 599 return FP_OKAY;
wolfSSL 0:9d17e4342598 600 }
wolfSSL 0:9d17e4342598 601
wolfSSL 0:9d17e4342598 602 /* b = a/2 */
wolfSSL 0:9d17e4342598 603 void fp_div_2(fp_int * a, fp_int * b)
wolfSSL 0:9d17e4342598 604 {
wolfSSL 0:9d17e4342598 605 int x, oldused;
wolfSSL 0:9d17e4342598 606
wolfSSL 0:9d17e4342598 607 oldused = b->used;
wolfSSL 0:9d17e4342598 608 b->used = a->used;
wolfSSL 0:9d17e4342598 609 {
wolfSSL 0:9d17e4342598 610 register fp_digit r, rr, *tmpa, *tmpb;
wolfSSL 0:9d17e4342598 611
wolfSSL 0:9d17e4342598 612 /* source alias */
wolfSSL 0:9d17e4342598 613 tmpa = a->dp + b->used - 1;
wolfSSL 0:9d17e4342598 614
wolfSSL 0:9d17e4342598 615 /* dest alias */
wolfSSL 0:9d17e4342598 616 tmpb = b->dp + b->used - 1;
wolfSSL 0:9d17e4342598 617
wolfSSL 0:9d17e4342598 618 /* carry */
wolfSSL 0:9d17e4342598 619 r = 0;
wolfSSL 0:9d17e4342598 620 for (x = b->used - 1; x >= 0; x--) {
wolfSSL 0:9d17e4342598 621 /* get the carry for the next iteration */
wolfSSL 0:9d17e4342598 622 rr = *tmpa & 1;
wolfSSL 0:9d17e4342598 623
wolfSSL 0:9d17e4342598 624 /* shift the current digit, add in carry and store */
wolfSSL 0:9d17e4342598 625 *tmpb-- = (*tmpa-- >> 1) | (r << (DIGIT_BIT - 1));
wolfSSL 0:9d17e4342598 626
wolfSSL 0:9d17e4342598 627 /* forward carry to next iteration */
wolfSSL 0:9d17e4342598 628 r = rr;
wolfSSL 0:9d17e4342598 629 }
wolfSSL 0:9d17e4342598 630
wolfSSL 0:9d17e4342598 631 /* zero excess digits */
wolfSSL 0:9d17e4342598 632 tmpb = b->dp + b->used;
wolfSSL 0:9d17e4342598 633 for (x = b->used; x < oldused; x++) {
wolfSSL 0:9d17e4342598 634 *tmpb++ = 0;
wolfSSL 0:9d17e4342598 635 }
wolfSSL 0:9d17e4342598 636 }
wolfSSL 0:9d17e4342598 637 b->sign = a->sign;
wolfSSL 0:9d17e4342598 638 fp_clamp (b);
wolfSSL 0:9d17e4342598 639 }
wolfSSL 0:9d17e4342598 640
wolfSSL 0:9d17e4342598 641 /* c = a / 2**b */
wolfSSL 0:9d17e4342598 642 void fp_div_2d(fp_int *a, int b, fp_int *c, fp_int *d)
wolfSSL 0:9d17e4342598 643 {
wolfSSL 0:9d17e4342598 644 int D;
wolfSSL 0:9d17e4342598 645 fp_int t;
wolfSSL 0:9d17e4342598 646
wolfSSL 0:9d17e4342598 647 /* if the shift count is <= 0 then we do no work */
wolfSSL 0:9d17e4342598 648 if (b <= 0) {
wolfSSL 0:9d17e4342598 649 fp_copy (a, c);
wolfSSL 0:9d17e4342598 650 if (d != NULL) {
wolfSSL 0:9d17e4342598 651 fp_zero (d);
wolfSSL 0:9d17e4342598 652 }
wolfSSL 0:9d17e4342598 653 return;
wolfSSL 0:9d17e4342598 654 }
wolfSSL 0:9d17e4342598 655
wolfSSL 0:9d17e4342598 656 fp_init(&t);
wolfSSL 0:9d17e4342598 657
wolfSSL 0:9d17e4342598 658 /* get the remainder */
wolfSSL 0:9d17e4342598 659 if (d != NULL) {
wolfSSL 0:9d17e4342598 660 fp_mod_2d (a, b, &t);
wolfSSL 0:9d17e4342598 661 }
wolfSSL 0:9d17e4342598 662
wolfSSL 0:9d17e4342598 663 /* copy */
wolfSSL 0:9d17e4342598 664 fp_copy(a, c);
wolfSSL 0:9d17e4342598 665
wolfSSL 0:9d17e4342598 666 /* shift by as many digits in the bit count */
wolfSSL 0:9d17e4342598 667 if (b >= (int)DIGIT_BIT) {
wolfSSL 0:9d17e4342598 668 fp_rshd (c, b / DIGIT_BIT);
wolfSSL 0:9d17e4342598 669 }
wolfSSL 0:9d17e4342598 670
wolfSSL 0:9d17e4342598 671 /* shift any bit count < DIGIT_BIT */
wolfSSL 0:9d17e4342598 672 D = (b % DIGIT_BIT);
wolfSSL 0:9d17e4342598 673 if (D != 0) {
wolfSSL 0:9d17e4342598 674 fp_rshb(c, D);
wolfSSL 0:9d17e4342598 675 }
wolfSSL 0:9d17e4342598 676 fp_clamp (c);
wolfSSL 0:9d17e4342598 677 if (d != NULL) {
wolfSSL 0:9d17e4342598 678 fp_copy (&t, d);
wolfSSL 0:9d17e4342598 679 }
wolfSSL 0:9d17e4342598 680 }
wolfSSL 0:9d17e4342598 681
wolfSSL 0:9d17e4342598 682 /* c = a mod b, 0 <= c < b */
wolfSSL 0:9d17e4342598 683 int fp_mod(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 684 {
wolfSSL 0:9d17e4342598 685 fp_int t;
wolfSSL 0:9d17e4342598 686 int err;
wolfSSL 0:9d17e4342598 687
wolfSSL 0:9d17e4342598 688 fp_zero(&t);
wolfSSL 0:9d17e4342598 689 if ((err = fp_div(a, b, NULL, &t)) != FP_OKAY) {
wolfSSL 0:9d17e4342598 690 return err;
wolfSSL 0:9d17e4342598 691 }
wolfSSL 0:9d17e4342598 692 if (t.sign != b->sign) {
wolfSSL 0:9d17e4342598 693 fp_add(&t, b, c);
wolfSSL 0:9d17e4342598 694 } else {
wolfSSL 0:9d17e4342598 695 fp_copy(&t, c);
wolfSSL 0:9d17e4342598 696 }
wolfSSL 0:9d17e4342598 697 return FP_OKAY;
wolfSSL 0:9d17e4342598 698 }
wolfSSL 0:9d17e4342598 699
wolfSSL 0:9d17e4342598 700 /* c = a mod 2**d */
wolfSSL 0:9d17e4342598 701 void fp_mod_2d(fp_int *a, int b, fp_int *c)
wolfSSL 0:9d17e4342598 702 {
wolfSSL 0:9d17e4342598 703 int x;
wolfSSL 0:9d17e4342598 704
wolfSSL 0:9d17e4342598 705 /* zero if count less than or equal to zero */
wolfSSL 0:9d17e4342598 706 if (b <= 0) {
wolfSSL 0:9d17e4342598 707 fp_zero(c);
wolfSSL 0:9d17e4342598 708 return;
wolfSSL 0:9d17e4342598 709 }
wolfSSL 0:9d17e4342598 710
wolfSSL 0:9d17e4342598 711 /* get copy of input */
wolfSSL 0:9d17e4342598 712 fp_copy(a, c);
wolfSSL 0:9d17e4342598 713
wolfSSL 0:9d17e4342598 714 /* if 2**d is larger than we just return */
wolfSSL 0:9d17e4342598 715 if (b >= (DIGIT_BIT * a->used)) {
wolfSSL 0:9d17e4342598 716 return;
wolfSSL 0:9d17e4342598 717 }
wolfSSL 0:9d17e4342598 718
wolfSSL 0:9d17e4342598 719 /* zero digits above the last digit of the modulus */
wolfSSL 0:9d17e4342598 720 for (x = (b / DIGIT_BIT) + ((b % DIGIT_BIT) == 0 ? 0 : 1); x < c->used; x++) {
wolfSSL 0:9d17e4342598 721 c->dp[x] = 0;
wolfSSL 0:9d17e4342598 722 }
wolfSSL 0:9d17e4342598 723 /* clear the digit that is not completely outside/inside the modulus */
wolfSSL 0:9d17e4342598 724 c->dp[b / DIGIT_BIT] &= ~((fp_digit)0) >> (DIGIT_BIT - b);
wolfSSL 0:9d17e4342598 725 fp_clamp (c);
wolfSSL 0:9d17e4342598 726 }
wolfSSL 0:9d17e4342598 727
wolfSSL 0:9d17e4342598 728 static int fp_invmod_slow (fp_int * a, fp_int * b, fp_int * c)
wolfSSL 0:9d17e4342598 729 {
wolfSSL 0:9d17e4342598 730 fp_int x, y, u, v, A, B, C, D;
wolfSSL 0:9d17e4342598 731 int res;
wolfSSL 0:9d17e4342598 732
wolfSSL 0:9d17e4342598 733 /* b cannot be negative */
wolfSSL 0:9d17e4342598 734 if (b->sign == FP_NEG || fp_iszero(b) == 1) {
wolfSSL 0:9d17e4342598 735 return FP_VAL;
wolfSSL 0:9d17e4342598 736 }
wolfSSL 0:9d17e4342598 737
wolfSSL 0:9d17e4342598 738 /* init temps */
wolfSSL 0:9d17e4342598 739 fp_init(&x); fp_init(&y);
wolfSSL 0:9d17e4342598 740 fp_init(&u); fp_init(&v);
wolfSSL 0:9d17e4342598 741 fp_init(&A); fp_init(&B);
wolfSSL 0:9d17e4342598 742 fp_init(&C); fp_init(&D);
wolfSSL 0:9d17e4342598 743
wolfSSL 0:9d17e4342598 744 /* x = a, y = b */
wolfSSL 0:9d17e4342598 745 if ((res = fp_mod(a, b, &x)) != FP_OKAY) {
wolfSSL 0:9d17e4342598 746 return res;
wolfSSL 0:9d17e4342598 747 }
wolfSSL 0:9d17e4342598 748 fp_copy(b, &y);
wolfSSL 0:9d17e4342598 749
wolfSSL 0:9d17e4342598 750 /* 2. [modified] if x,y are both even then return an error! */
wolfSSL 0:9d17e4342598 751 if (fp_iseven (&x) == 1 && fp_iseven (&y) == 1) {
wolfSSL 0:9d17e4342598 752 return FP_VAL;
wolfSSL 0:9d17e4342598 753 }
wolfSSL 0:9d17e4342598 754
wolfSSL 0:9d17e4342598 755 /* 3. u=x, v=y, A=1, B=0, C=0,D=1 */
wolfSSL 0:9d17e4342598 756 fp_copy (&x, &u);
wolfSSL 0:9d17e4342598 757 fp_copy (&y, &v);
wolfSSL 0:9d17e4342598 758 fp_set (&A, 1);
wolfSSL 0:9d17e4342598 759 fp_set (&D, 1);
wolfSSL 0:9d17e4342598 760
wolfSSL 0:9d17e4342598 761 top:
wolfSSL 0:9d17e4342598 762 /* 4. while u is even do */
wolfSSL 0:9d17e4342598 763 while (fp_iseven (&u) == 1) {
wolfSSL 0:9d17e4342598 764 /* 4.1 u = u/2 */
wolfSSL 0:9d17e4342598 765 fp_div_2 (&u, &u);
wolfSSL 0:9d17e4342598 766
wolfSSL 0:9d17e4342598 767 /* 4.2 if A or B is odd then */
wolfSSL 0:9d17e4342598 768 if (fp_isodd (&A) == 1 || fp_isodd (&B) == 1) {
wolfSSL 0:9d17e4342598 769 /* A = (A+y)/2, B = (B-x)/2 */
wolfSSL 0:9d17e4342598 770 fp_add (&A, &y, &A);
wolfSSL 0:9d17e4342598 771 fp_sub (&B, &x, &B);
wolfSSL 0:9d17e4342598 772 }
wolfSSL 0:9d17e4342598 773 /* A = A/2, B = B/2 */
wolfSSL 0:9d17e4342598 774 fp_div_2 (&A, &A);
wolfSSL 0:9d17e4342598 775 fp_div_2 (&B, &B);
wolfSSL 0:9d17e4342598 776 }
wolfSSL 0:9d17e4342598 777
wolfSSL 0:9d17e4342598 778 /* 5. while v is even do */
wolfSSL 0:9d17e4342598 779 while (fp_iseven (&v) == 1) {
wolfSSL 0:9d17e4342598 780 /* 5.1 v = v/2 */
wolfSSL 0:9d17e4342598 781 fp_div_2 (&v, &v);
wolfSSL 0:9d17e4342598 782
wolfSSL 0:9d17e4342598 783 /* 5.2 if C or D is odd then */
wolfSSL 0:9d17e4342598 784 if (fp_isodd (&C) == 1 || fp_isodd (&D) == 1) {
wolfSSL 0:9d17e4342598 785 /* C = (C+y)/2, D = (D-x)/2 */
wolfSSL 0:9d17e4342598 786 fp_add (&C, &y, &C);
wolfSSL 0:9d17e4342598 787 fp_sub (&D, &x, &D);
wolfSSL 0:9d17e4342598 788 }
wolfSSL 0:9d17e4342598 789 /* C = C/2, D = D/2 */
wolfSSL 0:9d17e4342598 790 fp_div_2 (&C, &C);
wolfSSL 0:9d17e4342598 791 fp_div_2 (&D, &D);
wolfSSL 0:9d17e4342598 792 }
wolfSSL 0:9d17e4342598 793
wolfSSL 0:9d17e4342598 794 /* 6. if u >= v then */
wolfSSL 0:9d17e4342598 795 if (fp_cmp (&u, &v) != FP_LT) {
wolfSSL 0:9d17e4342598 796 /* u = u - v, A = A - C, B = B - D */
wolfSSL 0:9d17e4342598 797 fp_sub (&u, &v, &u);
wolfSSL 0:9d17e4342598 798 fp_sub (&A, &C, &A);
wolfSSL 0:9d17e4342598 799 fp_sub (&B, &D, &B);
wolfSSL 0:9d17e4342598 800 } else {
wolfSSL 0:9d17e4342598 801 /* v - v - u, C = C - A, D = D - B */
wolfSSL 0:9d17e4342598 802 fp_sub (&v, &u, &v);
wolfSSL 0:9d17e4342598 803 fp_sub (&C, &A, &C);
wolfSSL 0:9d17e4342598 804 fp_sub (&D, &B, &D);
wolfSSL 0:9d17e4342598 805 }
wolfSSL 0:9d17e4342598 806
wolfSSL 0:9d17e4342598 807 /* if not zero goto step 4 */
wolfSSL 0:9d17e4342598 808 if (fp_iszero (&u) == 0)
wolfSSL 0:9d17e4342598 809 goto top;
wolfSSL 0:9d17e4342598 810
wolfSSL 0:9d17e4342598 811 /* now a = C, b = D, gcd == g*v */
wolfSSL 0:9d17e4342598 812
wolfSSL 0:9d17e4342598 813 /* if v != 1 then there is no inverse */
wolfSSL 0:9d17e4342598 814 if (fp_cmp_d (&v, 1) != FP_EQ) {
wolfSSL 0:9d17e4342598 815 return FP_VAL;
wolfSSL 0:9d17e4342598 816 }
wolfSSL 0:9d17e4342598 817
wolfSSL 0:9d17e4342598 818 /* if its too low */
wolfSSL 0:9d17e4342598 819 while (fp_cmp_d(&C, 0) == FP_LT) {
wolfSSL 0:9d17e4342598 820 fp_add(&C, b, &C);
wolfSSL 0:9d17e4342598 821 }
wolfSSL 0:9d17e4342598 822
wolfSSL 0:9d17e4342598 823 /* too big */
wolfSSL 0:9d17e4342598 824 while (fp_cmp_mag(&C, b) != FP_LT) {
wolfSSL 0:9d17e4342598 825 fp_sub(&C, b, &C);
wolfSSL 0:9d17e4342598 826 }
wolfSSL 0:9d17e4342598 827
wolfSSL 0:9d17e4342598 828 /* C is now the inverse */
wolfSSL 0:9d17e4342598 829 fp_copy(&C, c);
wolfSSL 0:9d17e4342598 830 return FP_OKAY;
wolfSSL 0:9d17e4342598 831 }
wolfSSL 0:9d17e4342598 832
wolfSSL 0:9d17e4342598 833 /* c = 1/a (mod b) for odd b only */
wolfSSL 0:9d17e4342598 834 int fp_invmod(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 835 {
wolfSSL 0:9d17e4342598 836 fp_int x, y, u, v, B, D;
wolfSSL 0:9d17e4342598 837 int neg;
wolfSSL 0:9d17e4342598 838
wolfSSL 0:9d17e4342598 839 /* 2. [modified] b must be odd */
wolfSSL 0:9d17e4342598 840 if (fp_iseven (b) == FP_YES) {
wolfSSL 0:9d17e4342598 841 return fp_invmod_slow(a,b,c);
wolfSSL 0:9d17e4342598 842 }
wolfSSL 0:9d17e4342598 843
wolfSSL 0:9d17e4342598 844 /* init all our temps */
wolfSSL 0:9d17e4342598 845 fp_init(&x); fp_init(&y);
wolfSSL 0:9d17e4342598 846 fp_init(&u); fp_init(&v);
wolfSSL 0:9d17e4342598 847 fp_init(&B); fp_init(&D);
wolfSSL 0:9d17e4342598 848
wolfSSL 0:9d17e4342598 849 /* x == modulus, y == value to invert */
wolfSSL 0:9d17e4342598 850 fp_copy(b, &x);
wolfSSL 0:9d17e4342598 851
wolfSSL 0:9d17e4342598 852 /* we need y = |a| */
wolfSSL 0:9d17e4342598 853 fp_abs(a, &y);
wolfSSL 0:9d17e4342598 854
wolfSSL 0:9d17e4342598 855 /* 3. u=x, v=y, A=1, B=0, C=0,D=1 */
wolfSSL 0:9d17e4342598 856 fp_copy(&x, &u);
wolfSSL 0:9d17e4342598 857 fp_copy(&y, &v);
wolfSSL 0:9d17e4342598 858 fp_set (&D, 1);
wolfSSL 0:9d17e4342598 859
wolfSSL 0:9d17e4342598 860 top:
wolfSSL 0:9d17e4342598 861 /* 4. while u is even do */
wolfSSL 0:9d17e4342598 862 while (fp_iseven (&u) == FP_YES) {
wolfSSL 0:9d17e4342598 863 /* 4.1 u = u/2 */
wolfSSL 0:9d17e4342598 864 fp_div_2 (&u, &u);
wolfSSL 0:9d17e4342598 865
wolfSSL 0:9d17e4342598 866 /* 4.2 if B is odd then */
wolfSSL 0:9d17e4342598 867 if (fp_isodd (&B) == FP_YES) {
wolfSSL 0:9d17e4342598 868 fp_sub (&B, &x, &B);
wolfSSL 0:9d17e4342598 869 }
wolfSSL 0:9d17e4342598 870 /* B = B/2 */
wolfSSL 0:9d17e4342598 871 fp_div_2 (&B, &B);
wolfSSL 0:9d17e4342598 872 }
wolfSSL 0:9d17e4342598 873
wolfSSL 0:9d17e4342598 874 /* 5. while v is even do */
wolfSSL 0:9d17e4342598 875 while (fp_iseven (&v) == FP_YES) {
wolfSSL 0:9d17e4342598 876 /* 5.1 v = v/2 */
wolfSSL 0:9d17e4342598 877 fp_div_2 (&v, &v);
wolfSSL 0:9d17e4342598 878
wolfSSL 0:9d17e4342598 879 /* 5.2 if D is odd then */
wolfSSL 0:9d17e4342598 880 if (fp_isodd (&D) == FP_YES) {
wolfSSL 0:9d17e4342598 881 /* D = (D-x)/2 */
wolfSSL 0:9d17e4342598 882 fp_sub (&D, &x, &D);
wolfSSL 0:9d17e4342598 883 }
wolfSSL 0:9d17e4342598 884 /* D = D/2 */
wolfSSL 0:9d17e4342598 885 fp_div_2 (&D, &D);
wolfSSL 0:9d17e4342598 886 }
wolfSSL 0:9d17e4342598 887
wolfSSL 0:9d17e4342598 888 /* 6. if u >= v then */
wolfSSL 0:9d17e4342598 889 if (fp_cmp (&u, &v) != FP_LT) {
wolfSSL 0:9d17e4342598 890 /* u = u - v, B = B - D */
wolfSSL 0:9d17e4342598 891 fp_sub (&u, &v, &u);
wolfSSL 0:9d17e4342598 892 fp_sub (&B, &D, &B);
wolfSSL 0:9d17e4342598 893 } else {
wolfSSL 0:9d17e4342598 894 /* v - v - u, D = D - B */
wolfSSL 0:9d17e4342598 895 fp_sub (&v, &u, &v);
wolfSSL 0:9d17e4342598 896 fp_sub (&D, &B, &D);
wolfSSL 0:9d17e4342598 897 }
wolfSSL 0:9d17e4342598 898
wolfSSL 0:9d17e4342598 899 /* if not zero goto step 4 */
wolfSSL 0:9d17e4342598 900 if (fp_iszero (&u) == FP_NO) {
wolfSSL 0:9d17e4342598 901 goto top;
wolfSSL 0:9d17e4342598 902 }
wolfSSL 0:9d17e4342598 903
wolfSSL 0:9d17e4342598 904 /* now a = C, b = D, gcd == g*v */
wolfSSL 0:9d17e4342598 905
wolfSSL 0:9d17e4342598 906 /* if v != 1 then there is no inverse */
wolfSSL 0:9d17e4342598 907 if (fp_cmp_d (&v, 1) != FP_EQ) {
wolfSSL 0:9d17e4342598 908 return FP_VAL;
wolfSSL 0:9d17e4342598 909 }
wolfSSL 0:9d17e4342598 910
wolfSSL 0:9d17e4342598 911 /* b is now the inverse */
wolfSSL 0:9d17e4342598 912 neg = a->sign;
wolfSSL 0:9d17e4342598 913 while (D.sign == FP_NEG) {
wolfSSL 0:9d17e4342598 914 fp_add (&D, b, &D);
wolfSSL 0:9d17e4342598 915 }
wolfSSL 0:9d17e4342598 916 fp_copy (&D, c);
wolfSSL 0:9d17e4342598 917 c->sign = neg;
wolfSSL 0:9d17e4342598 918 return FP_OKAY;
wolfSSL 0:9d17e4342598 919 }
wolfSSL 0:9d17e4342598 920
wolfSSL 0:9d17e4342598 921 /* d = a * b (mod c) */
wolfSSL 0:9d17e4342598 922 int fp_mulmod(fp_int *a, fp_int *b, fp_int *c, fp_int *d)
wolfSSL 0:9d17e4342598 923 {
wolfSSL 0:9d17e4342598 924 fp_int tmp;
wolfSSL 0:9d17e4342598 925 fp_zero(&tmp);
wolfSSL 0:9d17e4342598 926 fp_mul(a, b, &tmp);
wolfSSL 0:9d17e4342598 927 return fp_mod(&tmp, c, d);
wolfSSL 0:9d17e4342598 928 }
wolfSSL 0:9d17e4342598 929
wolfSSL 0:9d17e4342598 930 #ifdef TFM_TIMING_RESISTANT
wolfSSL 0:9d17e4342598 931
wolfSSL 0:9d17e4342598 932 /* timing resistant montgomery ladder based exptmod
wolfSSL 0:9d17e4342598 933
wolfSSL 0:9d17e4342598 934 Based on work by Marc Joye, Sung-Ming Yen, "The Montgomery Powering Ladder", Cryptographic Hardware and Embedded Systems, CHES 2002
wolfSSL 0:9d17e4342598 935 */
wolfSSL 0:9d17e4342598 936 static int _fp_exptmod(fp_int * G, fp_int * X, fp_int * P, fp_int * Y)
wolfSSL 0:9d17e4342598 937 {
wolfSSL 0:9d17e4342598 938 fp_int R[2];
wolfSSL 0:9d17e4342598 939 fp_digit buf, mp;
wolfSSL 0:9d17e4342598 940 int err, bitcnt, digidx, y;
wolfSSL 0:9d17e4342598 941
wolfSSL 0:9d17e4342598 942 /* now setup montgomery */
wolfSSL 0:9d17e4342598 943 if ((err = fp_montgomery_setup (P, &mp)) != FP_OKAY) {
wolfSSL 0:9d17e4342598 944 return err;
wolfSSL 0:9d17e4342598 945 }
wolfSSL 0:9d17e4342598 946
wolfSSL 0:9d17e4342598 947 fp_init(&R[0]);
wolfSSL 0:9d17e4342598 948 fp_init(&R[1]);
wolfSSL 0:9d17e4342598 949
wolfSSL 0:9d17e4342598 950 /* now we need R mod m */
wolfSSL 0:9d17e4342598 951 fp_montgomery_calc_normalization (&R[0], P);
wolfSSL 0:9d17e4342598 952
wolfSSL 0:9d17e4342598 953 /* now set R[0][1] to G * R mod m */
wolfSSL 0:9d17e4342598 954 if (fp_cmp_mag(P, G) != FP_GT) {
wolfSSL 0:9d17e4342598 955 /* G > P so we reduce it first */
wolfSSL 0:9d17e4342598 956 fp_mod(G, P, &R[1]);
wolfSSL 0:9d17e4342598 957 } else {
wolfSSL 0:9d17e4342598 958 fp_copy(G, &R[1]);
wolfSSL 0:9d17e4342598 959 }
wolfSSL 0:9d17e4342598 960 fp_mulmod (&R[1], &R[0], P, &R[1]);
wolfSSL 0:9d17e4342598 961
wolfSSL 0:9d17e4342598 962 /* for j = t-1 downto 0 do
wolfSSL 0:9d17e4342598 963 r_!k = R0*R1; r_k = r_k^2
wolfSSL 0:9d17e4342598 964 */
wolfSSL 0:9d17e4342598 965
wolfSSL 0:9d17e4342598 966 /* set initial mode and bit cnt */
wolfSSL 0:9d17e4342598 967 bitcnt = 1;
wolfSSL 0:9d17e4342598 968 buf = 0;
wolfSSL 0:9d17e4342598 969 digidx = X->used - 1;
wolfSSL 0:9d17e4342598 970
wolfSSL 0:9d17e4342598 971 for (;;) {
wolfSSL 0:9d17e4342598 972 /* grab next digit as required */
wolfSSL 0:9d17e4342598 973 if (--bitcnt == 0) {
wolfSSL 0:9d17e4342598 974 /* if digidx == -1 we are out of digits so break */
wolfSSL 0:9d17e4342598 975 if (digidx == -1) {
wolfSSL 0:9d17e4342598 976 break;
wolfSSL 0:9d17e4342598 977 }
wolfSSL 0:9d17e4342598 978 /* read next digit and reset bitcnt */
wolfSSL 0:9d17e4342598 979 buf = X->dp[digidx--];
wolfSSL 0:9d17e4342598 980 bitcnt = (int)DIGIT_BIT;
wolfSSL 0:9d17e4342598 981 }
wolfSSL 0:9d17e4342598 982
wolfSSL 0:9d17e4342598 983 /* grab the next msb from the exponent */
wolfSSL 0:9d17e4342598 984 y = (int)(buf >> (DIGIT_BIT - 1)) & 1;
wolfSSL 0:9d17e4342598 985 buf <<= (fp_digit)1;
wolfSSL 0:9d17e4342598 986
wolfSSL 0:9d17e4342598 987 /* do ops */
wolfSSL 0:9d17e4342598 988 fp_mul(&R[0], &R[1], &R[y^1]); fp_montgomery_reduce(&R[y^1], P, mp);
wolfSSL 0:9d17e4342598 989 fp_sqr(&R[y], &R[y]); fp_montgomery_reduce(&R[y], P, mp);
wolfSSL 0:9d17e4342598 990 }
wolfSSL 0:9d17e4342598 991
wolfSSL 0:9d17e4342598 992 fp_montgomery_reduce(&R[0], P, mp);
wolfSSL 0:9d17e4342598 993 fp_copy(&R[0], Y);
wolfSSL 0:9d17e4342598 994 return FP_OKAY;
wolfSSL 0:9d17e4342598 995 }
wolfSSL 0:9d17e4342598 996
wolfSSL 0:9d17e4342598 997 #else
wolfSSL 0:9d17e4342598 998
wolfSSL 0:9d17e4342598 999 /* y = g**x (mod b)
wolfSSL 0:9d17e4342598 1000 * Some restrictions... x must be positive and < b
wolfSSL 0:9d17e4342598 1001 */
wolfSSL 0:9d17e4342598 1002 static int _fp_exptmod(fp_int * G, fp_int * X, fp_int * P, fp_int * Y)
wolfSSL 0:9d17e4342598 1003 {
wolfSSL 0:9d17e4342598 1004 fp_int M[64], res;
wolfSSL 0:9d17e4342598 1005 fp_digit buf, mp;
wolfSSL 0:9d17e4342598 1006 int err, bitbuf, bitcpy, bitcnt, mode, digidx, x, y, winsize;
wolfSSL 0:9d17e4342598 1007
wolfSSL 0:9d17e4342598 1008 /* find window size */
wolfSSL 0:9d17e4342598 1009 x = fp_count_bits (X);
wolfSSL 0:9d17e4342598 1010 if (x <= 21) {
wolfSSL 0:9d17e4342598 1011 winsize = 1;
wolfSSL 0:9d17e4342598 1012 } else if (x <= 36) {
wolfSSL 0:9d17e4342598 1013 winsize = 3;
wolfSSL 0:9d17e4342598 1014 } else if (x <= 140) {
wolfSSL 0:9d17e4342598 1015 winsize = 4;
wolfSSL 0:9d17e4342598 1016 } else if (x <= 450) {
wolfSSL 0:9d17e4342598 1017 winsize = 5;
wolfSSL 0:9d17e4342598 1018 } else {
wolfSSL 0:9d17e4342598 1019 winsize = 6;
wolfSSL 0:9d17e4342598 1020 }
wolfSSL 0:9d17e4342598 1021
wolfSSL 0:9d17e4342598 1022 /* init M array */
wolfSSL 0:9d17e4342598 1023 XMEMSET(M, 0, sizeof(M));
wolfSSL 0:9d17e4342598 1024
wolfSSL 0:9d17e4342598 1025 /* now setup montgomery */
wolfSSL 0:9d17e4342598 1026 if ((err = fp_montgomery_setup (P, &mp)) != FP_OKAY) {
wolfSSL 0:9d17e4342598 1027 return err;
wolfSSL 0:9d17e4342598 1028 }
wolfSSL 0:9d17e4342598 1029
wolfSSL 0:9d17e4342598 1030 /* setup result */
wolfSSL 0:9d17e4342598 1031 fp_init(&res);
wolfSSL 0:9d17e4342598 1032
wolfSSL 0:9d17e4342598 1033 /* create M table
wolfSSL 0:9d17e4342598 1034 *
wolfSSL 0:9d17e4342598 1035 * The M table contains powers of the input base, e.g. M[x] = G^x mod P
wolfSSL 0:9d17e4342598 1036 *
wolfSSL 0:9d17e4342598 1037 * The first half of the table is not computed though accept for M[0] and M[1]
wolfSSL 0:9d17e4342598 1038 */
wolfSSL 0:9d17e4342598 1039
wolfSSL 0:9d17e4342598 1040 /* now we need R mod m */
wolfSSL 0:9d17e4342598 1041 fp_montgomery_calc_normalization (&res, P);
wolfSSL 0:9d17e4342598 1042
wolfSSL 0:9d17e4342598 1043 /* now set M[1] to G * R mod m */
wolfSSL 0:9d17e4342598 1044 if (fp_cmp_mag(P, G) != FP_GT) {
wolfSSL 0:9d17e4342598 1045 /* G > P so we reduce it first */
wolfSSL 0:9d17e4342598 1046 fp_mod(G, P, &M[1]);
wolfSSL 0:9d17e4342598 1047 } else {
wolfSSL 0:9d17e4342598 1048 fp_copy(G, &M[1]);
wolfSSL 0:9d17e4342598 1049 }
wolfSSL 0:9d17e4342598 1050 fp_mulmod (&M[1], &res, P, &M[1]);
wolfSSL 0:9d17e4342598 1051
wolfSSL 0:9d17e4342598 1052 /* compute the value at M[1<<(winsize-1)] by squaring M[1] (winsize-1) times */
wolfSSL 0:9d17e4342598 1053 fp_copy (&M[1], &M[1 << (winsize - 1)]);
wolfSSL 0:9d17e4342598 1054 for (x = 0; x < (winsize - 1); x++) {
wolfSSL 0:9d17e4342598 1055 fp_sqr (&M[1 << (winsize - 1)], &M[1 << (winsize - 1)]);
wolfSSL 0:9d17e4342598 1056 fp_montgomery_reduce (&M[1 << (winsize - 1)], P, mp);
wolfSSL 0:9d17e4342598 1057 }
wolfSSL 0:9d17e4342598 1058
wolfSSL 0:9d17e4342598 1059 /* create upper table */
wolfSSL 0:9d17e4342598 1060 for (x = (1 << (winsize - 1)) + 1; x < (1 << winsize); x++) {
wolfSSL 0:9d17e4342598 1061 fp_mul(&M[x - 1], &M[1], &M[x]);
wolfSSL 0:9d17e4342598 1062 fp_montgomery_reduce(&M[x], P, mp);
wolfSSL 0:9d17e4342598 1063 }
wolfSSL 0:9d17e4342598 1064
wolfSSL 0:9d17e4342598 1065 /* set initial mode and bit cnt */
wolfSSL 0:9d17e4342598 1066 mode = 0;
wolfSSL 0:9d17e4342598 1067 bitcnt = 1;
wolfSSL 0:9d17e4342598 1068 buf = 0;
wolfSSL 0:9d17e4342598 1069 digidx = X->used - 1;
wolfSSL 0:9d17e4342598 1070 bitcpy = 0;
wolfSSL 0:9d17e4342598 1071 bitbuf = 0;
wolfSSL 0:9d17e4342598 1072
wolfSSL 0:9d17e4342598 1073 for (;;) {
wolfSSL 0:9d17e4342598 1074 /* grab next digit as required */
wolfSSL 0:9d17e4342598 1075 if (--bitcnt == 0) {
wolfSSL 0:9d17e4342598 1076 /* if digidx == -1 we are out of digits so break */
wolfSSL 0:9d17e4342598 1077 if (digidx == -1) {
wolfSSL 0:9d17e4342598 1078 break;
wolfSSL 0:9d17e4342598 1079 }
wolfSSL 0:9d17e4342598 1080 /* read next digit and reset bitcnt */
wolfSSL 0:9d17e4342598 1081 buf = X->dp[digidx--];
wolfSSL 0:9d17e4342598 1082 bitcnt = (int)DIGIT_BIT;
wolfSSL 0:9d17e4342598 1083 }
wolfSSL 0:9d17e4342598 1084
wolfSSL 0:9d17e4342598 1085 /* grab the next msb from the exponent */
wolfSSL 0:9d17e4342598 1086 y = (int)(buf >> (DIGIT_BIT - 1)) & 1;
wolfSSL 0:9d17e4342598 1087 buf <<= (fp_digit)1;
wolfSSL 0:9d17e4342598 1088
wolfSSL 0:9d17e4342598 1089 /* if the bit is zero and mode == 0 then we ignore it
wolfSSL 0:9d17e4342598 1090 * These represent the leading zero bits before the first 1 bit
wolfSSL 0:9d17e4342598 1091 * in the exponent. Technically this opt is not required but it
wolfSSL 0:9d17e4342598 1092 * does lower the # of trivial squaring/reductions used
wolfSSL 0:9d17e4342598 1093 */
wolfSSL 0:9d17e4342598 1094 if (mode == 0 && y == 0) {
wolfSSL 0:9d17e4342598 1095 continue;
wolfSSL 0:9d17e4342598 1096 }
wolfSSL 0:9d17e4342598 1097
wolfSSL 0:9d17e4342598 1098 /* if the bit is zero and mode == 1 then we square */
wolfSSL 0:9d17e4342598 1099 if (mode == 1 && y == 0) {
wolfSSL 0:9d17e4342598 1100 fp_sqr(&res, &res);
wolfSSL 0:9d17e4342598 1101 fp_montgomery_reduce(&res, P, mp);
wolfSSL 0:9d17e4342598 1102 continue;
wolfSSL 0:9d17e4342598 1103 }
wolfSSL 0:9d17e4342598 1104
wolfSSL 0:9d17e4342598 1105 /* else we add it to the window */
wolfSSL 0:9d17e4342598 1106 bitbuf |= (y << (winsize - ++bitcpy));
wolfSSL 0:9d17e4342598 1107 mode = 2;
wolfSSL 0:9d17e4342598 1108
wolfSSL 0:9d17e4342598 1109 if (bitcpy == winsize) {
wolfSSL 0:9d17e4342598 1110 /* ok window is filled so square as required and multiply */
wolfSSL 0:9d17e4342598 1111 /* square first */
wolfSSL 0:9d17e4342598 1112 for (x = 0; x < winsize; x++) {
wolfSSL 0:9d17e4342598 1113 fp_sqr(&res, &res);
wolfSSL 0:9d17e4342598 1114 fp_montgomery_reduce(&res, P, mp);
wolfSSL 0:9d17e4342598 1115 }
wolfSSL 0:9d17e4342598 1116
wolfSSL 0:9d17e4342598 1117 /* then multiply */
wolfSSL 0:9d17e4342598 1118 fp_mul(&res, &M[bitbuf], &res);
wolfSSL 0:9d17e4342598 1119 fp_montgomery_reduce(&res, P, mp);
wolfSSL 0:9d17e4342598 1120
wolfSSL 0:9d17e4342598 1121 /* empty window and reset */
wolfSSL 0:9d17e4342598 1122 bitcpy = 0;
wolfSSL 0:9d17e4342598 1123 bitbuf = 0;
wolfSSL 0:9d17e4342598 1124 mode = 1;
wolfSSL 0:9d17e4342598 1125 }
wolfSSL 0:9d17e4342598 1126 }
wolfSSL 0:9d17e4342598 1127
wolfSSL 0:9d17e4342598 1128 /* if bits remain then square/multiply */
wolfSSL 0:9d17e4342598 1129 if (mode == 2 && bitcpy > 0) {
wolfSSL 0:9d17e4342598 1130 /* square then multiply if the bit is set */
wolfSSL 0:9d17e4342598 1131 for (x = 0; x < bitcpy; x++) {
wolfSSL 0:9d17e4342598 1132 fp_sqr(&res, &res);
wolfSSL 0:9d17e4342598 1133 fp_montgomery_reduce(&res, P, mp);
wolfSSL 0:9d17e4342598 1134
wolfSSL 0:9d17e4342598 1135 /* get next bit of the window */
wolfSSL 0:9d17e4342598 1136 bitbuf <<= 1;
wolfSSL 0:9d17e4342598 1137 if ((bitbuf & (1 << winsize)) != 0) {
wolfSSL 0:9d17e4342598 1138 /* then multiply */
wolfSSL 0:9d17e4342598 1139 fp_mul(&res, &M[1], &res);
wolfSSL 0:9d17e4342598 1140 fp_montgomery_reduce(&res, P, mp);
wolfSSL 0:9d17e4342598 1141 }
wolfSSL 0:9d17e4342598 1142 }
wolfSSL 0:9d17e4342598 1143 }
wolfSSL 0:9d17e4342598 1144
wolfSSL 0:9d17e4342598 1145 /* fixup result if Montgomery reduction is used
wolfSSL 0:9d17e4342598 1146 * recall that any value in a Montgomery system is
wolfSSL 0:9d17e4342598 1147 * actually multiplied by R mod n. So we have
wolfSSL 0:9d17e4342598 1148 * to reduce one more time to cancel out the factor
wolfSSL 0:9d17e4342598 1149 * of R.
wolfSSL 0:9d17e4342598 1150 */
wolfSSL 0:9d17e4342598 1151 fp_montgomery_reduce(&res, P, mp);
wolfSSL 0:9d17e4342598 1152
wolfSSL 0:9d17e4342598 1153 /* swap res with Y */
wolfSSL 0:9d17e4342598 1154 fp_copy (&res, Y);
wolfSSL 0:9d17e4342598 1155 return FP_OKAY;
wolfSSL 0:9d17e4342598 1156 }
wolfSSL 0:9d17e4342598 1157
wolfSSL 0:9d17e4342598 1158 #endif
wolfSSL 0:9d17e4342598 1159
wolfSSL 0:9d17e4342598 1160 int fp_exptmod(fp_int * G, fp_int * X, fp_int * P, fp_int * Y)
wolfSSL 0:9d17e4342598 1161 {
wolfSSL 0:9d17e4342598 1162 /* prevent overflows */
wolfSSL 0:9d17e4342598 1163 if (P->used > (FP_SIZE/2)) {
wolfSSL 0:9d17e4342598 1164 return FP_VAL;
wolfSSL 0:9d17e4342598 1165 }
wolfSSL 0:9d17e4342598 1166
wolfSSL 0:9d17e4342598 1167 if (X->sign == FP_NEG) {
wolfSSL 0:9d17e4342598 1168 #ifndef POSITIVE_EXP_ONLY /* reduce stack if assume no negatives */
wolfSSL 0:9d17e4342598 1169 int err;
wolfSSL 0:9d17e4342598 1170 fp_int tmp;
wolfSSL 0:9d17e4342598 1171
wolfSSL 0:9d17e4342598 1172 /* yes, copy G and invmod it */
wolfSSL 0:9d17e4342598 1173 fp_copy(G, &tmp);
wolfSSL 0:9d17e4342598 1174 if ((err = fp_invmod(&tmp, P, &tmp)) != FP_OKAY) {
wolfSSL 0:9d17e4342598 1175 return err;
wolfSSL 0:9d17e4342598 1176 }
wolfSSL 0:9d17e4342598 1177 X->sign = FP_ZPOS;
wolfSSL 0:9d17e4342598 1178 err = _fp_exptmod(&tmp, X, P, Y);
wolfSSL 0:9d17e4342598 1179 if (X != Y) {
wolfSSL 0:9d17e4342598 1180 X->sign = FP_NEG;
wolfSSL 0:9d17e4342598 1181 }
wolfSSL 0:9d17e4342598 1182 return err;
wolfSSL 0:9d17e4342598 1183 #else
wolfSSL 0:9d17e4342598 1184 return FP_VAL;
wolfSSL 0:9d17e4342598 1185 #endif
wolfSSL 0:9d17e4342598 1186 }
wolfSSL 0:9d17e4342598 1187 else {
wolfSSL 0:9d17e4342598 1188 /* Positive exponent so just exptmod */
wolfSSL 0:9d17e4342598 1189 return _fp_exptmod(G, X, P, Y);
wolfSSL 0:9d17e4342598 1190 }
wolfSSL 0:9d17e4342598 1191 }
wolfSSL 0:9d17e4342598 1192
wolfSSL 0:9d17e4342598 1193 /* computes a = 2**b */
wolfSSL 0:9d17e4342598 1194 void fp_2expt(fp_int *a, int b)
wolfSSL 0:9d17e4342598 1195 {
wolfSSL 0:9d17e4342598 1196 int z;
wolfSSL 0:9d17e4342598 1197
wolfSSL 0:9d17e4342598 1198 /* zero a as per default */
wolfSSL 0:9d17e4342598 1199 fp_zero (a);
wolfSSL 0:9d17e4342598 1200
wolfSSL 0:9d17e4342598 1201 if (b < 0) {
wolfSSL 0:9d17e4342598 1202 return;
wolfSSL 0:9d17e4342598 1203 }
wolfSSL 0:9d17e4342598 1204
wolfSSL 0:9d17e4342598 1205 z = b / DIGIT_BIT;
wolfSSL 0:9d17e4342598 1206 if (z >= FP_SIZE) {
wolfSSL 0:9d17e4342598 1207 return;
wolfSSL 0:9d17e4342598 1208 }
wolfSSL 0:9d17e4342598 1209
wolfSSL 0:9d17e4342598 1210 /* set the used count of where the bit will go */
wolfSSL 0:9d17e4342598 1211 a->used = z + 1;
wolfSSL 0:9d17e4342598 1212
wolfSSL 0:9d17e4342598 1213 /* put the single bit in its place */
wolfSSL 0:9d17e4342598 1214 a->dp[z] = ((fp_digit)1) << (b % DIGIT_BIT);
wolfSSL 0:9d17e4342598 1215 }
wolfSSL 0:9d17e4342598 1216
wolfSSL 0:9d17e4342598 1217 /* b = a*a */
wolfSSL 0:9d17e4342598 1218 void fp_sqr(fp_int *A, fp_int *B)
wolfSSL 0:9d17e4342598 1219 {
wolfSSL 0:9d17e4342598 1220 int y = A->used;
wolfSSL 0:9d17e4342598 1221
wolfSSL 0:9d17e4342598 1222 /* call generic if we're out of range */
wolfSSL 0:9d17e4342598 1223 if (y + y > FP_SIZE) {
wolfSSL 0:9d17e4342598 1224 fp_sqr_comba(A, B);
wolfSSL 0:9d17e4342598 1225 return ;
wolfSSL 0:9d17e4342598 1226 }
wolfSSL 0:9d17e4342598 1227
wolfSSL 0:9d17e4342598 1228 #if defined(TFM_SQR3)
wolfSSL 0:9d17e4342598 1229 if (y <= 3) {
wolfSSL 0:9d17e4342598 1230 fp_sqr_comba3(A,B);
wolfSSL 0:9d17e4342598 1231 return;
wolfSSL 0:9d17e4342598 1232 }
wolfSSL 0:9d17e4342598 1233 #endif
wolfSSL 0:9d17e4342598 1234 #if defined(TFM_SQR4)
wolfSSL 0:9d17e4342598 1235 if (y == 4) {
wolfSSL 0:9d17e4342598 1236 fp_sqr_comba4(A,B);
wolfSSL 0:9d17e4342598 1237 return;
wolfSSL 0:9d17e4342598 1238 }
wolfSSL 0:9d17e4342598 1239 #endif
wolfSSL 0:9d17e4342598 1240 #if defined(TFM_SQR6)
wolfSSL 0:9d17e4342598 1241 if (y <= 6) {
wolfSSL 0:9d17e4342598 1242 fp_sqr_comba6(A,B);
wolfSSL 0:9d17e4342598 1243 return;
wolfSSL 0:9d17e4342598 1244 }
wolfSSL 0:9d17e4342598 1245 #endif
wolfSSL 0:9d17e4342598 1246 #if defined(TFM_SQR7)
wolfSSL 0:9d17e4342598 1247 if (y == 7) {
wolfSSL 0:9d17e4342598 1248 fp_sqr_comba7(A,B);
wolfSSL 0:9d17e4342598 1249 return;
wolfSSL 0:9d17e4342598 1250 }
wolfSSL 0:9d17e4342598 1251 #endif
wolfSSL 0:9d17e4342598 1252 #if defined(TFM_SQR8)
wolfSSL 0:9d17e4342598 1253 if (y == 8) {
wolfSSL 0:9d17e4342598 1254 fp_sqr_comba8(A,B);
wolfSSL 0:9d17e4342598 1255 return;
wolfSSL 0:9d17e4342598 1256 }
wolfSSL 0:9d17e4342598 1257 #endif
wolfSSL 0:9d17e4342598 1258 #if defined(TFM_SQR9)
wolfSSL 0:9d17e4342598 1259 if (y == 9) {
wolfSSL 0:9d17e4342598 1260 fp_sqr_comba9(A,B);
wolfSSL 0:9d17e4342598 1261 return;
wolfSSL 0:9d17e4342598 1262 }
wolfSSL 0:9d17e4342598 1263 #endif
wolfSSL 0:9d17e4342598 1264 #if defined(TFM_SQR12)
wolfSSL 0:9d17e4342598 1265 if (y <= 12) {
wolfSSL 0:9d17e4342598 1266 fp_sqr_comba12(A,B);
wolfSSL 0:9d17e4342598 1267 return;
wolfSSL 0:9d17e4342598 1268 }
wolfSSL 0:9d17e4342598 1269 #endif
wolfSSL 0:9d17e4342598 1270 #if defined(TFM_SQR17)
wolfSSL 0:9d17e4342598 1271 if (y <= 17) {
wolfSSL 0:9d17e4342598 1272 fp_sqr_comba17(A,B);
wolfSSL 0:9d17e4342598 1273 return;
wolfSSL 0:9d17e4342598 1274 }
wolfSSL 0:9d17e4342598 1275 #endif
wolfSSL 0:9d17e4342598 1276 #if defined(TFM_SMALL_SET)
wolfSSL 0:9d17e4342598 1277 if (y <= 16) {
wolfSSL 0:9d17e4342598 1278 fp_sqr_comba_small(A,B);
wolfSSL 0:9d17e4342598 1279 return;
wolfSSL 0:9d17e4342598 1280 }
wolfSSL 0:9d17e4342598 1281 #endif
wolfSSL 0:9d17e4342598 1282 #if defined(TFM_SQR20)
wolfSSL 0:9d17e4342598 1283 if (y <= 20) {
wolfSSL 0:9d17e4342598 1284 fp_sqr_comba20(A,B);
wolfSSL 0:9d17e4342598 1285 return;
wolfSSL 0:9d17e4342598 1286 }
wolfSSL 0:9d17e4342598 1287 #endif
wolfSSL 0:9d17e4342598 1288 #if defined(TFM_SQR24)
wolfSSL 0:9d17e4342598 1289 if (y <= 24) {
wolfSSL 0:9d17e4342598 1290 fp_sqr_comba24(A,B);
wolfSSL 0:9d17e4342598 1291 return;
wolfSSL 0:9d17e4342598 1292 }
wolfSSL 0:9d17e4342598 1293 #endif
wolfSSL 0:9d17e4342598 1294 #if defined(TFM_SQR28)
wolfSSL 0:9d17e4342598 1295 if (y <= 28) {
wolfSSL 0:9d17e4342598 1296 fp_sqr_comba28(A,B);
wolfSSL 0:9d17e4342598 1297 return;
wolfSSL 0:9d17e4342598 1298 }
wolfSSL 0:9d17e4342598 1299 #endif
wolfSSL 0:9d17e4342598 1300 #if defined(TFM_SQR32)
wolfSSL 0:9d17e4342598 1301 if (y <= 32) {
wolfSSL 0:9d17e4342598 1302 fp_sqr_comba32(A,B);
wolfSSL 0:9d17e4342598 1303 return;
wolfSSL 0:9d17e4342598 1304 }
wolfSSL 0:9d17e4342598 1305 #endif
wolfSSL 0:9d17e4342598 1306 #if defined(TFM_SQR48)
wolfSSL 0:9d17e4342598 1307 if (y <= 48) {
wolfSSL 0:9d17e4342598 1308 fp_sqr_comba48(A,B);
wolfSSL 0:9d17e4342598 1309 return;
wolfSSL 0:9d17e4342598 1310 }
wolfSSL 0:9d17e4342598 1311 #endif
wolfSSL 0:9d17e4342598 1312 #if defined(TFM_SQR64)
wolfSSL 0:9d17e4342598 1313 if (y <= 64) {
wolfSSL 0:9d17e4342598 1314 fp_sqr_comba64(A,B);
wolfSSL 0:9d17e4342598 1315 return;
wolfSSL 0:9d17e4342598 1316 }
wolfSSL 0:9d17e4342598 1317 #endif
wolfSSL 0:9d17e4342598 1318 fp_sqr_comba(A, B);
wolfSSL 0:9d17e4342598 1319 }
wolfSSL 0:9d17e4342598 1320
wolfSSL 0:9d17e4342598 1321 /* generic comba squarer */
wolfSSL 0:9d17e4342598 1322 void fp_sqr_comba(fp_int *A, fp_int *B)
wolfSSL 0:9d17e4342598 1323 {
wolfSSL 0:9d17e4342598 1324 int pa, ix, iz;
wolfSSL 0:9d17e4342598 1325 fp_digit c0, c1, c2;
wolfSSL 0:9d17e4342598 1326 fp_int tmp, *dst;
wolfSSL 0:9d17e4342598 1327 #ifdef TFM_ISO
wolfSSL 0:9d17e4342598 1328 fp_word tt;
wolfSSL 0:9d17e4342598 1329 #endif
wolfSSL 0:9d17e4342598 1330
wolfSSL 0:9d17e4342598 1331 /* get size of output and trim */
wolfSSL 0:9d17e4342598 1332 pa = A->used + A->used;
wolfSSL 0:9d17e4342598 1333 if (pa >= FP_SIZE) {
wolfSSL 0:9d17e4342598 1334 pa = FP_SIZE-1;
wolfSSL 0:9d17e4342598 1335 }
wolfSSL 0:9d17e4342598 1336
wolfSSL 0:9d17e4342598 1337 /* number of output digits to produce */
wolfSSL 0:9d17e4342598 1338 COMBA_START;
wolfSSL 0:9d17e4342598 1339 COMBA_CLEAR;
wolfSSL 0:9d17e4342598 1340
wolfSSL 0:9d17e4342598 1341 if (A == B) {
wolfSSL 0:9d17e4342598 1342 fp_zero(&tmp);
wolfSSL 0:9d17e4342598 1343 dst = &tmp;
wolfSSL 0:9d17e4342598 1344 } else {
wolfSSL 0:9d17e4342598 1345 fp_zero(B);
wolfSSL 0:9d17e4342598 1346 dst = B;
wolfSSL 0:9d17e4342598 1347 }
wolfSSL 0:9d17e4342598 1348
wolfSSL 0:9d17e4342598 1349 for (ix = 0; ix < pa; ix++) {
wolfSSL 0:9d17e4342598 1350 int tx, ty, iy;
wolfSSL 0:9d17e4342598 1351 fp_digit *tmpy, *tmpx;
wolfSSL 0:9d17e4342598 1352
wolfSSL 0:9d17e4342598 1353 /* get offsets into the two bignums */
wolfSSL 0:9d17e4342598 1354 ty = MIN(A->used-1, ix);
wolfSSL 0:9d17e4342598 1355 tx = ix - ty;
wolfSSL 0:9d17e4342598 1356
wolfSSL 0:9d17e4342598 1357 /* setup temp aliases */
wolfSSL 0:9d17e4342598 1358 tmpx = A->dp + tx;
wolfSSL 0:9d17e4342598 1359 tmpy = A->dp + ty;
wolfSSL 0:9d17e4342598 1360
wolfSSL 0:9d17e4342598 1361 /* this is the number of times the loop will iterrate,
wolfSSL 0:9d17e4342598 1362 while (tx++ < a->used && ty-- >= 0) { ... }
wolfSSL 0:9d17e4342598 1363 */
wolfSSL 0:9d17e4342598 1364 iy = MIN(A->used-tx, ty+1);
wolfSSL 0:9d17e4342598 1365
wolfSSL 0:9d17e4342598 1366 /* now for squaring tx can never equal ty
wolfSSL 0:9d17e4342598 1367 * we halve the distance since they approach
wolfSSL 0:9d17e4342598 1368 * at a rate of 2x and we have to round because
wolfSSL 0:9d17e4342598 1369 * odd cases need to be executed
wolfSSL 0:9d17e4342598 1370 */
wolfSSL 0:9d17e4342598 1371 iy = MIN(iy, (ty-tx+1)>>1);
wolfSSL 0:9d17e4342598 1372
wolfSSL 0:9d17e4342598 1373 /* forward carries */
wolfSSL 0:9d17e4342598 1374 COMBA_FORWARD;
wolfSSL 0:9d17e4342598 1375
wolfSSL 0:9d17e4342598 1376 /* execute loop */
wolfSSL 0:9d17e4342598 1377 for (iz = 0; iz < iy; iz++) {
wolfSSL 0:9d17e4342598 1378 SQRADD2(*tmpx++, *tmpy--);
wolfSSL 0:9d17e4342598 1379 }
wolfSSL 0:9d17e4342598 1380
wolfSSL 0:9d17e4342598 1381 /* even columns have the square term in them */
wolfSSL 0:9d17e4342598 1382 if ((ix&1) == 0) {
wolfSSL 0:9d17e4342598 1383 /* TAO change COMBA_ADD back to SQRADD */
wolfSSL 0:9d17e4342598 1384 SQRADD(A->dp[ix>>1], A->dp[ix>>1]);
wolfSSL 0:9d17e4342598 1385 }
wolfSSL 0:9d17e4342598 1386
wolfSSL 0:9d17e4342598 1387 /* store it */
wolfSSL 0:9d17e4342598 1388 COMBA_STORE(dst->dp[ix]);
wolfSSL 0:9d17e4342598 1389 }
wolfSSL 0:9d17e4342598 1390
wolfSSL 0:9d17e4342598 1391 COMBA_FINI;
wolfSSL 0:9d17e4342598 1392
wolfSSL 0:9d17e4342598 1393 /* setup dest */
wolfSSL 0:9d17e4342598 1394 dst->used = pa;
wolfSSL 0:9d17e4342598 1395 fp_clamp (dst);
wolfSSL 0:9d17e4342598 1396 if (dst != B) {
wolfSSL 0:9d17e4342598 1397 fp_copy(dst, B);
wolfSSL 0:9d17e4342598 1398 }
wolfSSL 0:9d17e4342598 1399 }
wolfSSL 0:9d17e4342598 1400
wolfSSL 0:9d17e4342598 1401 int fp_cmp(fp_int *a, fp_int *b)
wolfSSL 0:9d17e4342598 1402 {
wolfSSL 0:9d17e4342598 1403 if (a->sign == FP_NEG && b->sign == FP_ZPOS) {
wolfSSL 0:9d17e4342598 1404 return FP_LT;
wolfSSL 0:9d17e4342598 1405 } else if (a->sign == FP_ZPOS && b->sign == FP_NEG) {
wolfSSL 0:9d17e4342598 1406 return FP_GT;
wolfSSL 0:9d17e4342598 1407 } else {
wolfSSL 0:9d17e4342598 1408 /* compare digits */
wolfSSL 0:9d17e4342598 1409 if (a->sign == FP_NEG) {
wolfSSL 0:9d17e4342598 1410 /* if negative compare opposite direction */
wolfSSL 0:9d17e4342598 1411 return fp_cmp_mag(b, a);
wolfSSL 0:9d17e4342598 1412 } else {
wolfSSL 0:9d17e4342598 1413 return fp_cmp_mag(a, b);
wolfSSL 0:9d17e4342598 1414 }
wolfSSL 0:9d17e4342598 1415 }
wolfSSL 0:9d17e4342598 1416 }
wolfSSL 0:9d17e4342598 1417
wolfSSL 0:9d17e4342598 1418 /* compare against a single digit */
wolfSSL 0:9d17e4342598 1419 int fp_cmp_d(fp_int *a, fp_digit b)
wolfSSL 0:9d17e4342598 1420 {
wolfSSL 0:9d17e4342598 1421 /* compare based on sign */
wolfSSL 0:9d17e4342598 1422 if ((b && a->used == 0) || a->sign == FP_NEG) {
wolfSSL 0:9d17e4342598 1423 return FP_LT;
wolfSSL 0:9d17e4342598 1424 }
wolfSSL 0:9d17e4342598 1425
wolfSSL 0:9d17e4342598 1426 /* compare based on magnitude */
wolfSSL 0:9d17e4342598 1427 if (a->used > 1) {
wolfSSL 0:9d17e4342598 1428 return FP_GT;
wolfSSL 0:9d17e4342598 1429 }
wolfSSL 0:9d17e4342598 1430
wolfSSL 0:9d17e4342598 1431 /* compare the only digit of a to b */
wolfSSL 0:9d17e4342598 1432 if (a->dp[0] > b) {
wolfSSL 0:9d17e4342598 1433 return FP_GT;
wolfSSL 0:9d17e4342598 1434 } else if (a->dp[0] < b) {
wolfSSL 0:9d17e4342598 1435 return FP_LT;
wolfSSL 0:9d17e4342598 1436 } else {
wolfSSL 0:9d17e4342598 1437 return FP_EQ;
wolfSSL 0:9d17e4342598 1438 }
wolfSSL 0:9d17e4342598 1439
wolfSSL 0:9d17e4342598 1440 }
wolfSSL 0:9d17e4342598 1441
wolfSSL 0:9d17e4342598 1442 int fp_cmp_mag(fp_int *a, fp_int *b)
wolfSSL 0:9d17e4342598 1443 {
wolfSSL 0:9d17e4342598 1444 int x;
wolfSSL 0:9d17e4342598 1445
wolfSSL 0:9d17e4342598 1446 if (a->used > b->used) {
wolfSSL 0:9d17e4342598 1447 return FP_GT;
wolfSSL 0:9d17e4342598 1448 } else if (a->used < b->used) {
wolfSSL 0:9d17e4342598 1449 return FP_LT;
wolfSSL 0:9d17e4342598 1450 } else {
wolfSSL 0:9d17e4342598 1451 for (x = a->used - 1; x >= 0; x--) {
wolfSSL 0:9d17e4342598 1452 if (a->dp[x] > b->dp[x]) {
wolfSSL 0:9d17e4342598 1453 return FP_GT;
wolfSSL 0:9d17e4342598 1454 } else if (a->dp[x] < b->dp[x]) {
wolfSSL 0:9d17e4342598 1455 return FP_LT;
wolfSSL 0:9d17e4342598 1456 }
wolfSSL 0:9d17e4342598 1457 }
wolfSSL 0:9d17e4342598 1458 }
wolfSSL 0:9d17e4342598 1459 return FP_EQ;
wolfSSL 0:9d17e4342598 1460 }
wolfSSL 0:9d17e4342598 1461
wolfSSL 0:9d17e4342598 1462 /* setups the montgomery reduction */
wolfSSL 0:9d17e4342598 1463 int fp_montgomery_setup(fp_int *a, fp_digit *rho)
wolfSSL 0:9d17e4342598 1464 {
wolfSSL 0:9d17e4342598 1465 fp_digit x, b;
wolfSSL 0:9d17e4342598 1466
wolfSSL 0:9d17e4342598 1467 /* fast inversion mod 2**k
wolfSSL 0:9d17e4342598 1468 *
wolfSSL 0:9d17e4342598 1469 * Based on the fact that
wolfSSL 0:9d17e4342598 1470 *
wolfSSL 0:9d17e4342598 1471 * XA = 1 (mod 2**n) => (X(2-XA)) A = 1 (mod 2**2n)
wolfSSL 0:9d17e4342598 1472 * => 2*X*A - X*X*A*A = 1
wolfSSL 0:9d17e4342598 1473 * => 2*(1) - (1) = 1
wolfSSL 0:9d17e4342598 1474 */
wolfSSL 0:9d17e4342598 1475 b = a->dp[0];
wolfSSL 0:9d17e4342598 1476
wolfSSL 0:9d17e4342598 1477 if ((b & 1) == 0) {
wolfSSL 0:9d17e4342598 1478 return FP_VAL;
wolfSSL 0:9d17e4342598 1479 }
wolfSSL 0:9d17e4342598 1480
wolfSSL 0:9d17e4342598 1481 x = (((b + 2) & 4) << 1) + b; /* here x*a==1 mod 2**4 */
wolfSSL 0:9d17e4342598 1482 x *= 2 - b * x; /* here x*a==1 mod 2**8 */
wolfSSL 0:9d17e4342598 1483 x *= 2 - b * x; /* here x*a==1 mod 2**16 */
wolfSSL 0:9d17e4342598 1484 x *= 2 - b * x; /* here x*a==1 mod 2**32 */
wolfSSL 0:9d17e4342598 1485 #ifdef FP_64BIT
wolfSSL 0:9d17e4342598 1486 x *= 2 - b * x; /* here x*a==1 mod 2**64 */
wolfSSL 0:9d17e4342598 1487 #endif
wolfSSL 0:9d17e4342598 1488
wolfSSL 0:9d17e4342598 1489 /* rho = -1/m mod b */
wolfSSL 0:9d17e4342598 1490 *rho = (fp_digit) (((fp_word) 1 << ((fp_word) DIGIT_BIT)) - ((fp_word)x));
wolfSSL 0:9d17e4342598 1491
wolfSSL 0:9d17e4342598 1492 return FP_OKAY;
wolfSSL 0:9d17e4342598 1493 }
wolfSSL 0:9d17e4342598 1494
wolfSSL 0:9d17e4342598 1495 /* computes a = B**n mod b without division or multiplication useful for
wolfSSL 0:9d17e4342598 1496 * normalizing numbers in a Montgomery system.
wolfSSL 0:9d17e4342598 1497 */
wolfSSL 0:9d17e4342598 1498 void fp_montgomery_calc_normalization(fp_int *a, fp_int *b)
wolfSSL 0:9d17e4342598 1499 {
wolfSSL 0:9d17e4342598 1500 int x, bits;
wolfSSL 0:9d17e4342598 1501
wolfSSL 0:9d17e4342598 1502 /* how many bits of last digit does b use */
wolfSSL 0:9d17e4342598 1503 bits = fp_count_bits (b) % DIGIT_BIT;
wolfSSL 0:9d17e4342598 1504 if (!bits) bits = DIGIT_BIT;
wolfSSL 0:9d17e4342598 1505
wolfSSL 0:9d17e4342598 1506 /* compute A = B^(n-1) * 2^(bits-1) */
wolfSSL 0:9d17e4342598 1507 if (b->used > 1) {
wolfSSL 0:9d17e4342598 1508 fp_2expt (a, (b->used - 1) * DIGIT_BIT + bits - 1);
wolfSSL 0:9d17e4342598 1509 } else {
wolfSSL 0:9d17e4342598 1510 fp_set(a, 1);
wolfSSL 0:9d17e4342598 1511 bits = 1;
wolfSSL 0:9d17e4342598 1512 }
wolfSSL 0:9d17e4342598 1513
wolfSSL 0:9d17e4342598 1514 /* now compute C = A * B mod b */
wolfSSL 0:9d17e4342598 1515 for (x = bits - 1; x < (int)DIGIT_BIT; x++) {
wolfSSL 0:9d17e4342598 1516 fp_mul_2 (a, a);
wolfSSL 0:9d17e4342598 1517 if (fp_cmp_mag (a, b) != FP_LT) {
wolfSSL 0:9d17e4342598 1518 s_fp_sub (a, b, a);
wolfSSL 0:9d17e4342598 1519 }
wolfSSL 0:9d17e4342598 1520 }
wolfSSL 0:9d17e4342598 1521 }
wolfSSL 0:9d17e4342598 1522
wolfSSL 0:9d17e4342598 1523
wolfSSL 0:9d17e4342598 1524 #ifdef TFM_SMALL_MONT_SET
wolfSSL 0:9d17e4342598 1525 #include "fp_mont_small.i"
wolfSSL 0:9d17e4342598 1526 #endif
wolfSSL 0:9d17e4342598 1527
wolfSSL 0:9d17e4342598 1528 /* computes x/R == x (mod N) via Montgomery Reduction */
wolfSSL 0:9d17e4342598 1529 void fp_montgomery_reduce(fp_int *a, fp_int *m, fp_digit mp)
wolfSSL 0:9d17e4342598 1530 {
wolfSSL 0:9d17e4342598 1531 fp_digit c[FP_SIZE], *_c, *tmpm, mu = 0;
wolfSSL 0:9d17e4342598 1532 int oldused, x, y, pa;
wolfSSL 0:9d17e4342598 1533
wolfSSL 0:9d17e4342598 1534 /* bail if too large */
wolfSSL 0:9d17e4342598 1535 if (m->used > (FP_SIZE/2)) {
wolfSSL 0:9d17e4342598 1536 (void)mu; /* shut up compiler */
wolfSSL 0:9d17e4342598 1537 return;
wolfSSL 0:9d17e4342598 1538 }
wolfSSL 0:9d17e4342598 1539
wolfSSL 0:9d17e4342598 1540 #ifdef TFM_SMALL_MONT_SET
wolfSSL 0:9d17e4342598 1541 if (m->used <= 16) {
wolfSSL 0:9d17e4342598 1542 fp_montgomery_reduce_small(a, m, mp);
wolfSSL 0:9d17e4342598 1543 return;
wolfSSL 0:9d17e4342598 1544 }
wolfSSL 0:9d17e4342598 1545 #endif
wolfSSL 0:9d17e4342598 1546
wolfSSL 0:9d17e4342598 1547
wolfSSL 0:9d17e4342598 1548 /* now zero the buff */
wolfSSL 0:9d17e4342598 1549 XMEMSET(c, 0, sizeof c);
wolfSSL 0:9d17e4342598 1550 pa = m->used;
wolfSSL 0:9d17e4342598 1551
wolfSSL 0:9d17e4342598 1552 /* copy the input */
wolfSSL 0:9d17e4342598 1553 oldused = a->used;
wolfSSL 0:9d17e4342598 1554 for (x = 0; x < oldused; x++) {
wolfSSL 0:9d17e4342598 1555 c[x] = a->dp[x];
wolfSSL 0:9d17e4342598 1556 }
wolfSSL 0:9d17e4342598 1557 MONT_START;
wolfSSL 0:9d17e4342598 1558
wolfSSL 0:9d17e4342598 1559 for (x = 0; x < pa; x++) {
wolfSSL 0:9d17e4342598 1560 fp_digit cy = 0;
wolfSSL 0:9d17e4342598 1561 /* get Mu for this round */
wolfSSL 0:9d17e4342598 1562 LOOP_START;
wolfSSL 0:9d17e4342598 1563 _c = c + x;
wolfSSL 0:9d17e4342598 1564 tmpm = m->dp;
wolfSSL 0:9d17e4342598 1565 y = 0;
wolfSSL 0:9d17e4342598 1566 #if (defined(TFM_SSE2) || defined(TFM_X86_64))
wolfSSL 0:9d17e4342598 1567 for (; y < (pa & ~7); y += 8) {
wolfSSL 0:9d17e4342598 1568 INNERMUL8;
wolfSSL 0:9d17e4342598 1569 _c += 8;
wolfSSL 0:9d17e4342598 1570 tmpm += 8;
wolfSSL 0:9d17e4342598 1571 }
wolfSSL 0:9d17e4342598 1572 #endif
wolfSSL 0:9d17e4342598 1573
wolfSSL 0:9d17e4342598 1574 for (; y < pa; y++) {
wolfSSL 0:9d17e4342598 1575 INNERMUL;
wolfSSL 0:9d17e4342598 1576 ++_c;
wolfSSL 0:9d17e4342598 1577 }
wolfSSL 0:9d17e4342598 1578 LOOP_END;
wolfSSL 0:9d17e4342598 1579 while (cy) {
wolfSSL 0:9d17e4342598 1580 PROPCARRY;
wolfSSL 0:9d17e4342598 1581 ++_c;
wolfSSL 0:9d17e4342598 1582 }
wolfSSL 0:9d17e4342598 1583 }
wolfSSL 0:9d17e4342598 1584
wolfSSL 0:9d17e4342598 1585 /* now copy out */
wolfSSL 0:9d17e4342598 1586 _c = c + pa;
wolfSSL 0:9d17e4342598 1587 tmpm = a->dp;
wolfSSL 0:9d17e4342598 1588 for (x = 0; x < pa+1; x++) {
wolfSSL 0:9d17e4342598 1589 *tmpm++ = *_c++;
wolfSSL 0:9d17e4342598 1590 }
wolfSSL 0:9d17e4342598 1591
wolfSSL 0:9d17e4342598 1592 for (; x < oldused; x++) {
wolfSSL 0:9d17e4342598 1593 *tmpm++ = 0;
wolfSSL 0:9d17e4342598 1594 }
wolfSSL 0:9d17e4342598 1595
wolfSSL 0:9d17e4342598 1596 MONT_FINI;
wolfSSL 0:9d17e4342598 1597
wolfSSL 0:9d17e4342598 1598 a->used = pa+1;
wolfSSL 0:9d17e4342598 1599 fp_clamp(a);
wolfSSL 0:9d17e4342598 1600
wolfSSL 0:9d17e4342598 1601 /* if A >= m then A = A - m */
wolfSSL 0:9d17e4342598 1602 if (fp_cmp_mag (a, m) != FP_LT) {
wolfSSL 0:9d17e4342598 1603 s_fp_sub (a, m, a);
wolfSSL 0:9d17e4342598 1604 }
wolfSSL 0:9d17e4342598 1605 }
wolfSSL 0:9d17e4342598 1606
wolfSSL 0:9d17e4342598 1607 void fp_read_unsigned_bin(fp_int *a, unsigned char *b, int c)
wolfSSL 0:9d17e4342598 1608 {
wolfSSL 0:9d17e4342598 1609 /* zero the int */
wolfSSL 0:9d17e4342598 1610 fp_zero (a);
wolfSSL 0:9d17e4342598 1611
wolfSSL 0:9d17e4342598 1612 /* If we know the endianness of this architecture, and we're using
wolfSSL 0:9d17e4342598 1613 32-bit fp_digits, we can optimize this */
wolfSSL 0:9d17e4342598 1614 #if (defined(LITTLE_ENDIAN_ORDER) || defined(BIG_ENDIAN_ORDER)) && !defined(FP_64BIT)
wolfSSL 0:9d17e4342598 1615 /* But not for both simultaneously */
wolfSSL 0:9d17e4342598 1616 #if defined(LITTLE_ENDIAN_ORDER) && defined(BIG_ENDIAN_ORDER)
wolfSSL 0:9d17e4342598 1617 #error Both LITTLE_ENDIAN_ORDER and BIG_ENDIAN_ORDER defined.
wolfSSL 0:9d17e4342598 1618 #endif
wolfSSL 0:9d17e4342598 1619 {
wolfSSL 0:9d17e4342598 1620 unsigned char *pd = (unsigned char *)a->dp;
wolfSSL 0:9d17e4342598 1621
wolfSSL 0:9d17e4342598 1622 if ((unsigned)c > (FP_SIZE * sizeof(fp_digit))) {
wolfSSL 0:9d17e4342598 1623 int excess = c - (FP_SIZE * sizeof(fp_digit));
wolfSSL 0:9d17e4342598 1624 c -= excess;
wolfSSL 0:9d17e4342598 1625 b += excess;
wolfSSL 0:9d17e4342598 1626 }
wolfSSL 0:9d17e4342598 1627 a->used = (c + sizeof(fp_digit) - 1)/sizeof(fp_digit);
wolfSSL 0:9d17e4342598 1628 /* read the bytes in */
wolfSSL 0:9d17e4342598 1629 #ifdef BIG_ENDIAN_ORDER
wolfSSL 0:9d17e4342598 1630 {
wolfSSL 0:9d17e4342598 1631 /* Use Duff's device to unroll the loop. */
wolfSSL 0:9d17e4342598 1632 int idx = (c - 1) & ~3;
wolfSSL 0:9d17e4342598 1633 switch (c % 4) {
wolfSSL 0:9d17e4342598 1634 case 0: do { pd[idx+0] = *b++;
wolfSSL 0:9d17e4342598 1635 case 3: pd[idx+1] = *b++;
wolfSSL 0:9d17e4342598 1636 case 2: pd[idx+2] = *b++;
wolfSSL 0:9d17e4342598 1637 case 1: pd[idx+3] = *b++;
wolfSSL 0:9d17e4342598 1638 idx -= 4;
wolfSSL 0:9d17e4342598 1639 } while ((c -= 4) > 0);
wolfSSL 0:9d17e4342598 1640 }
wolfSSL 0:9d17e4342598 1641 }
wolfSSL 0:9d17e4342598 1642 #else
wolfSSL 0:9d17e4342598 1643 for (c -= 1; c >= 0; c -= 1) {
wolfSSL 0:9d17e4342598 1644 pd[c] = *b++;
wolfSSL 0:9d17e4342598 1645 }
wolfSSL 0:9d17e4342598 1646 #endif
wolfSSL 0:9d17e4342598 1647 }
wolfSSL 0:9d17e4342598 1648 #else
wolfSSL 0:9d17e4342598 1649 /* read the bytes in */
wolfSSL 0:9d17e4342598 1650 for (; c > 0; c--) {
wolfSSL 0:9d17e4342598 1651 fp_mul_2d (a, 8, a);
wolfSSL 0:9d17e4342598 1652 a->dp[0] |= *b++;
wolfSSL 0:9d17e4342598 1653 a->used += 1;
wolfSSL 0:9d17e4342598 1654 }
wolfSSL 0:9d17e4342598 1655 #endif
wolfSSL 0:9d17e4342598 1656 fp_clamp (a);
wolfSSL 0:9d17e4342598 1657 }
wolfSSL 0:9d17e4342598 1658
wolfSSL 0:9d17e4342598 1659 void fp_to_unsigned_bin(fp_int *a, unsigned char *b)
wolfSSL 0:9d17e4342598 1660 {
wolfSSL 0:9d17e4342598 1661 int x;
wolfSSL 0:9d17e4342598 1662 fp_int t;
wolfSSL 0:9d17e4342598 1663
wolfSSL 0:9d17e4342598 1664 fp_init_copy(&t, a);
wolfSSL 0:9d17e4342598 1665
wolfSSL 0:9d17e4342598 1666 x = 0;
wolfSSL 0:9d17e4342598 1667 while (fp_iszero (&t) == FP_NO) {
wolfSSL 0:9d17e4342598 1668 b[x++] = (unsigned char) (t.dp[0] & 255);
wolfSSL 0:9d17e4342598 1669 fp_div_2d (&t, 8, &t, NULL);
wolfSSL 0:9d17e4342598 1670 }
wolfSSL 0:9d17e4342598 1671 fp_reverse (b, x);
wolfSSL 0:9d17e4342598 1672 }
wolfSSL 0:9d17e4342598 1673
wolfSSL 0:9d17e4342598 1674 int fp_unsigned_bin_size(fp_int *a)
wolfSSL 0:9d17e4342598 1675 {
wolfSSL 0:9d17e4342598 1676 int size = fp_count_bits (a);
wolfSSL 0:9d17e4342598 1677 return (size / 8 + ((size & 7) != 0 ? 1 : 0));
wolfSSL 0:9d17e4342598 1678 }
wolfSSL 0:9d17e4342598 1679
wolfSSL 0:9d17e4342598 1680 void fp_set(fp_int *a, fp_digit b)
wolfSSL 0:9d17e4342598 1681 {
wolfSSL 0:9d17e4342598 1682 fp_zero(a);
wolfSSL 0:9d17e4342598 1683 a->dp[0] = b;
wolfSSL 0:9d17e4342598 1684 a->used = a->dp[0] ? 1 : 0;
wolfSSL 0:9d17e4342598 1685 }
wolfSSL 0:9d17e4342598 1686
wolfSSL 0:9d17e4342598 1687 int fp_count_bits (fp_int * a)
wolfSSL 0:9d17e4342598 1688 {
wolfSSL 0:9d17e4342598 1689 int r;
wolfSSL 0:9d17e4342598 1690 fp_digit q;
wolfSSL 0:9d17e4342598 1691
wolfSSL 0:9d17e4342598 1692 /* shortcut */
wolfSSL 0:9d17e4342598 1693 if (a->used == 0) {
wolfSSL 0:9d17e4342598 1694 return 0;
wolfSSL 0:9d17e4342598 1695 }
wolfSSL 0:9d17e4342598 1696
wolfSSL 0:9d17e4342598 1697 /* get number of digits and add that */
wolfSSL 0:9d17e4342598 1698 r = (a->used - 1) * DIGIT_BIT;
wolfSSL 0:9d17e4342598 1699
wolfSSL 0:9d17e4342598 1700 /* take the last digit and count the bits in it */
wolfSSL 0:9d17e4342598 1701 q = a->dp[a->used - 1];
wolfSSL 0:9d17e4342598 1702 while (q > ((fp_digit) 0)) {
wolfSSL 0:9d17e4342598 1703 ++r;
wolfSSL 0:9d17e4342598 1704 q >>= ((fp_digit) 1);
wolfSSL 0:9d17e4342598 1705 }
wolfSSL 0:9d17e4342598 1706 return r;
wolfSSL 0:9d17e4342598 1707 }
wolfSSL 0:9d17e4342598 1708
wolfSSL 0:9d17e4342598 1709 int fp_leading_bit(fp_int *a)
wolfSSL 0:9d17e4342598 1710 {
wolfSSL 0:9d17e4342598 1711 int bit = 0;
wolfSSL 0:9d17e4342598 1712
wolfSSL 0:9d17e4342598 1713 if (a->used != 0) {
wolfSSL 0:9d17e4342598 1714 fp_digit q = a->dp[a->used - 1];
wolfSSL 0:9d17e4342598 1715 int qSz = sizeof(fp_digit);
wolfSSL 0:9d17e4342598 1716
wolfSSL 0:9d17e4342598 1717 while (qSz > 0) {
wolfSSL 0:9d17e4342598 1718 if ((unsigned char)q != 0)
wolfSSL 0:9d17e4342598 1719 bit = (q & 0x80) != 0;
wolfSSL 0:9d17e4342598 1720 q >>= 8;
wolfSSL 0:9d17e4342598 1721 qSz--;
wolfSSL 0:9d17e4342598 1722 }
wolfSSL 0:9d17e4342598 1723 }
wolfSSL 0:9d17e4342598 1724
wolfSSL 0:9d17e4342598 1725 return bit;
wolfSSL 0:9d17e4342598 1726 }
wolfSSL 0:9d17e4342598 1727
wolfSSL 0:9d17e4342598 1728 void fp_lshd(fp_int *a, int x)
wolfSSL 0:9d17e4342598 1729 {
wolfSSL 0:9d17e4342598 1730 int y;
wolfSSL 0:9d17e4342598 1731
wolfSSL 0:9d17e4342598 1732 /* move up and truncate as required */
wolfSSL 0:9d17e4342598 1733 y = MIN(a->used + x - 1, (int)(FP_SIZE-1));
wolfSSL 0:9d17e4342598 1734
wolfSSL 0:9d17e4342598 1735 /* store new size */
wolfSSL 0:9d17e4342598 1736 a->used = y + 1;
wolfSSL 0:9d17e4342598 1737
wolfSSL 0:9d17e4342598 1738 /* move digits */
wolfSSL 0:9d17e4342598 1739 for (; y >= x; y--) {
wolfSSL 0:9d17e4342598 1740 a->dp[y] = a->dp[y-x];
wolfSSL 0:9d17e4342598 1741 }
wolfSSL 0:9d17e4342598 1742
wolfSSL 0:9d17e4342598 1743 /* zero lower digits */
wolfSSL 0:9d17e4342598 1744 for (; y >= 0; y--) {
wolfSSL 0:9d17e4342598 1745 a->dp[y] = 0;
wolfSSL 0:9d17e4342598 1746 }
wolfSSL 0:9d17e4342598 1747
wolfSSL 0:9d17e4342598 1748 /* clamp digits */
wolfSSL 0:9d17e4342598 1749 fp_clamp(a);
wolfSSL 0:9d17e4342598 1750 }
wolfSSL 0:9d17e4342598 1751
wolfSSL 0:9d17e4342598 1752
wolfSSL 0:9d17e4342598 1753 /* right shift by bit count */
wolfSSL 0:9d17e4342598 1754 void fp_rshb(fp_int *c, int x)
wolfSSL 0:9d17e4342598 1755 {
wolfSSL 0:9d17e4342598 1756 register fp_digit *tmpc, mask, shift;
wolfSSL 0:9d17e4342598 1757 fp_digit r, rr;
wolfSSL 0:9d17e4342598 1758 fp_digit D = x;
wolfSSL 0:9d17e4342598 1759
wolfSSL 0:9d17e4342598 1760 /* mask */
wolfSSL 0:9d17e4342598 1761 mask = (((fp_digit)1) << D) - 1;
wolfSSL 0:9d17e4342598 1762
wolfSSL 0:9d17e4342598 1763 /* shift for lsb */
wolfSSL 0:9d17e4342598 1764 shift = DIGIT_BIT - D;
wolfSSL 0:9d17e4342598 1765
wolfSSL 0:9d17e4342598 1766 /* alias */
wolfSSL 0:9d17e4342598 1767 tmpc = c->dp + (c->used - 1);
wolfSSL 0:9d17e4342598 1768
wolfSSL 0:9d17e4342598 1769 /* carry */
wolfSSL 0:9d17e4342598 1770 r = 0;
wolfSSL 0:9d17e4342598 1771 for (x = c->used - 1; x >= 0; x--) {
wolfSSL 0:9d17e4342598 1772 /* get the lower bits of this word in a temp */
wolfSSL 0:9d17e4342598 1773 rr = *tmpc & mask;
wolfSSL 0:9d17e4342598 1774
wolfSSL 0:9d17e4342598 1775 /* shift the current word and mix in the carry bits from previous word */
wolfSSL 0:9d17e4342598 1776 *tmpc = (*tmpc >> D) | (r << shift);
wolfSSL 0:9d17e4342598 1777 --tmpc;
wolfSSL 0:9d17e4342598 1778
wolfSSL 0:9d17e4342598 1779 /* set the carry to the carry bits of the current word found above */
wolfSSL 0:9d17e4342598 1780 r = rr;
wolfSSL 0:9d17e4342598 1781 }
wolfSSL 0:9d17e4342598 1782 }
wolfSSL 0:9d17e4342598 1783
wolfSSL 0:9d17e4342598 1784
wolfSSL 0:9d17e4342598 1785 void fp_rshd(fp_int *a, int x)
wolfSSL 0:9d17e4342598 1786 {
wolfSSL 0:9d17e4342598 1787 int y;
wolfSSL 0:9d17e4342598 1788
wolfSSL 0:9d17e4342598 1789 /* too many digits just zero and return */
wolfSSL 0:9d17e4342598 1790 if (x >= a->used) {
wolfSSL 0:9d17e4342598 1791 fp_zero(a);
wolfSSL 0:9d17e4342598 1792 return;
wolfSSL 0:9d17e4342598 1793 }
wolfSSL 0:9d17e4342598 1794
wolfSSL 0:9d17e4342598 1795 /* shift */
wolfSSL 0:9d17e4342598 1796 for (y = 0; y < a->used - x; y++) {
wolfSSL 0:9d17e4342598 1797 a->dp[y] = a->dp[y+x];
wolfSSL 0:9d17e4342598 1798 }
wolfSSL 0:9d17e4342598 1799
wolfSSL 0:9d17e4342598 1800 /* zero rest */
wolfSSL 0:9d17e4342598 1801 for (; y < a->used; y++) {
wolfSSL 0:9d17e4342598 1802 a->dp[y] = 0;
wolfSSL 0:9d17e4342598 1803 }
wolfSSL 0:9d17e4342598 1804
wolfSSL 0:9d17e4342598 1805 /* decrement count */
wolfSSL 0:9d17e4342598 1806 a->used -= x;
wolfSSL 0:9d17e4342598 1807 fp_clamp(a);
wolfSSL 0:9d17e4342598 1808 }
wolfSSL 0:9d17e4342598 1809
wolfSSL 0:9d17e4342598 1810 /* reverse an array, used for radix code */
wolfSSL 0:9d17e4342598 1811 void fp_reverse (unsigned char *s, int len)
wolfSSL 0:9d17e4342598 1812 {
wolfSSL 0:9d17e4342598 1813 int ix, iy;
wolfSSL 0:9d17e4342598 1814 unsigned char t;
wolfSSL 0:9d17e4342598 1815
wolfSSL 0:9d17e4342598 1816 ix = 0;
wolfSSL 0:9d17e4342598 1817 iy = len - 1;
wolfSSL 0:9d17e4342598 1818 while (ix < iy) {
wolfSSL 0:9d17e4342598 1819 t = s[ix];
wolfSSL 0:9d17e4342598 1820 s[ix] = s[iy];
wolfSSL 0:9d17e4342598 1821 s[iy] = t;
wolfSSL 0:9d17e4342598 1822 ++ix;
wolfSSL 0:9d17e4342598 1823 --iy;
wolfSSL 0:9d17e4342598 1824 }
wolfSSL 0:9d17e4342598 1825 }
wolfSSL 0:9d17e4342598 1826
wolfSSL 0:9d17e4342598 1827
wolfSSL 0:9d17e4342598 1828 /* c = a - b */
wolfSSL 0:9d17e4342598 1829 void fp_sub_d(fp_int *a, fp_digit b, fp_int *c)
wolfSSL 0:9d17e4342598 1830 {
wolfSSL 0:9d17e4342598 1831 fp_int tmp;
wolfSSL 0:9d17e4342598 1832 fp_set(&tmp, b);
wolfSSL 0:9d17e4342598 1833 fp_sub(a, &tmp, c);
wolfSSL 0:9d17e4342598 1834 }
wolfSSL 0:9d17e4342598 1835
wolfSSL 0:9d17e4342598 1836
wolfSSL 0:9d17e4342598 1837 /* CyaSSL callers from normal lib */
wolfSSL 0:9d17e4342598 1838
wolfSSL 0:9d17e4342598 1839 /* init a new mp_int */
wolfSSL 0:9d17e4342598 1840 int mp_init (mp_int * a)
wolfSSL 0:9d17e4342598 1841 {
wolfSSL 0:9d17e4342598 1842 if (a)
wolfSSL 0:9d17e4342598 1843 fp_init(a);
wolfSSL 0:9d17e4342598 1844 return MP_OKAY;
wolfSSL 0:9d17e4342598 1845 }
wolfSSL 0:9d17e4342598 1846
wolfSSL 0:9d17e4342598 1847 /* clear one (frees) */
wolfSSL 0:9d17e4342598 1848 void mp_clear (mp_int * a)
wolfSSL 0:9d17e4342598 1849 {
wolfSSL 0:9d17e4342598 1850 fp_zero(a);
wolfSSL 0:9d17e4342598 1851 }
wolfSSL 0:9d17e4342598 1852
wolfSSL 0:9d17e4342598 1853 /* handle up to 6 inits */
wolfSSL 0:9d17e4342598 1854 int mp_init_multi(mp_int* a, mp_int* b, mp_int* c, mp_int* d, mp_int* e, mp_int* f)
wolfSSL 0:9d17e4342598 1855 {
wolfSSL 0:9d17e4342598 1856 if (a)
wolfSSL 0:9d17e4342598 1857 fp_init(a);
wolfSSL 0:9d17e4342598 1858 if (b)
wolfSSL 0:9d17e4342598 1859 fp_init(b);
wolfSSL 0:9d17e4342598 1860 if (c)
wolfSSL 0:9d17e4342598 1861 fp_init(c);
wolfSSL 0:9d17e4342598 1862 if (d)
wolfSSL 0:9d17e4342598 1863 fp_init(d);
wolfSSL 0:9d17e4342598 1864 if (e)
wolfSSL 0:9d17e4342598 1865 fp_init(e);
wolfSSL 0:9d17e4342598 1866 if (f)
wolfSSL 0:9d17e4342598 1867 fp_init(f);
wolfSSL 0:9d17e4342598 1868
wolfSSL 0:9d17e4342598 1869 return MP_OKAY;
wolfSSL 0:9d17e4342598 1870 }
wolfSSL 0:9d17e4342598 1871
wolfSSL 0:9d17e4342598 1872 /* high level addition (handles signs) */
wolfSSL 0:9d17e4342598 1873 int mp_add (mp_int * a, mp_int * b, mp_int * c)
wolfSSL 0:9d17e4342598 1874 {
wolfSSL 0:9d17e4342598 1875 fp_add(a, b, c);
wolfSSL 0:9d17e4342598 1876 return MP_OKAY;
wolfSSL 0:9d17e4342598 1877 }
wolfSSL 0:9d17e4342598 1878
wolfSSL 0:9d17e4342598 1879 /* high level subtraction (handles signs) */
wolfSSL 0:9d17e4342598 1880 int mp_sub (mp_int * a, mp_int * b, mp_int * c)
wolfSSL 0:9d17e4342598 1881 {
wolfSSL 0:9d17e4342598 1882 fp_sub(a, b, c);
wolfSSL 0:9d17e4342598 1883 return MP_OKAY;
wolfSSL 0:9d17e4342598 1884 }
wolfSSL 0:9d17e4342598 1885
wolfSSL 0:9d17e4342598 1886 /* high level multiplication (handles sign) */
wolfSSL 0:9d17e4342598 1887 int mp_mul (mp_int * a, mp_int * b, mp_int * c)
wolfSSL 0:9d17e4342598 1888 {
wolfSSL 0:9d17e4342598 1889 fp_mul(a, b, c);
wolfSSL 0:9d17e4342598 1890 return MP_OKAY;
wolfSSL 0:9d17e4342598 1891 }
wolfSSL 0:9d17e4342598 1892
wolfSSL 0:9d17e4342598 1893 /* d = a * b (mod c) */
wolfSSL 0:9d17e4342598 1894 int mp_mulmod (mp_int * a, mp_int * b, mp_int * c, mp_int * d)
wolfSSL 0:9d17e4342598 1895 {
wolfSSL 0:9d17e4342598 1896 return fp_mulmod(a, b, c, d);
wolfSSL 0:9d17e4342598 1897 }
wolfSSL 0:9d17e4342598 1898
wolfSSL 0:9d17e4342598 1899 /* c = a mod b, 0 <= c < b */
wolfSSL 0:9d17e4342598 1900 int mp_mod (mp_int * a, mp_int * b, mp_int * c)
wolfSSL 0:9d17e4342598 1901 {
wolfSSL 0:9d17e4342598 1902 return fp_mod (a, b, c);
wolfSSL 0:9d17e4342598 1903 }
wolfSSL 0:9d17e4342598 1904
wolfSSL 0:9d17e4342598 1905 /* hac 14.61, pp608 */
wolfSSL 0:9d17e4342598 1906 int mp_invmod (mp_int * a, mp_int * b, mp_int * c)
wolfSSL 0:9d17e4342598 1907 {
wolfSSL 0:9d17e4342598 1908 return fp_invmod(a, b, c);
wolfSSL 0:9d17e4342598 1909 }
wolfSSL 0:9d17e4342598 1910
wolfSSL 0:9d17e4342598 1911 /* this is a shell function that calls either the normal or Montgomery
wolfSSL 0:9d17e4342598 1912 * exptmod functions. Originally the call to the montgomery code was
wolfSSL 0:9d17e4342598 1913 * embedded in the normal function but that wasted alot of stack space
wolfSSL 0:9d17e4342598 1914 * for nothing (since 99% of the time the Montgomery code would be called)
wolfSSL 0:9d17e4342598 1915 */
wolfSSL 0:9d17e4342598 1916 int mp_exptmod (mp_int * G, mp_int * X, mp_int * P, mp_int * Y)
wolfSSL 0:9d17e4342598 1917 {
wolfSSL 0:9d17e4342598 1918 return fp_exptmod(G, X, P, Y);
wolfSSL 0:9d17e4342598 1919 }
wolfSSL 0:9d17e4342598 1920
wolfSSL 0:9d17e4342598 1921 /* compare two ints (signed)*/
wolfSSL 0:9d17e4342598 1922 int mp_cmp (mp_int * a, mp_int * b)
wolfSSL 0:9d17e4342598 1923 {
wolfSSL 0:9d17e4342598 1924 return fp_cmp(a, b);
wolfSSL 0:9d17e4342598 1925 }
wolfSSL 0:9d17e4342598 1926
wolfSSL 0:9d17e4342598 1927 /* compare a digit */
wolfSSL 0:9d17e4342598 1928 int mp_cmp_d(mp_int * a, mp_digit b)
wolfSSL 0:9d17e4342598 1929 {
wolfSSL 0:9d17e4342598 1930 return fp_cmp_d(a, b);
wolfSSL 0:9d17e4342598 1931 }
wolfSSL 0:9d17e4342598 1932
wolfSSL 0:9d17e4342598 1933 /* get the size for an unsigned equivalent */
wolfSSL 0:9d17e4342598 1934 int mp_unsigned_bin_size (mp_int * a)
wolfSSL 0:9d17e4342598 1935 {
wolfSSL 0:9d17e4342598 1936 return fp_unsigned_bin_size(a);
wolfSSL 0:9d17e4342598 1937 }
wolfSSL 0:9d17e4342598 1938
wolfSSL 0:9d17e4342598 1939 /* store in unsigned [big endian] format */
wolfSSL 0:9d17e4342598 1940 int mp_to_unsigned_bin (mp_int * a, unsigned char *b)
wolfSSL 0:9d17e4342598 1941 {
wolfSSL 0:9d17e4342598 1942 fp_to_unsigned_bin(a,b);
wolfSSL 0:9d17e4342598 1943 return MP_OKAY;
wolfSSL 0:9d17e4342598 1944 }
wolfSSL 0:9d17e4342598 1945
wolfSSL 0:9d17e4342598 1946 /* reads a unsigned char array, assumes the msb is stored first [big endian] */
wolfSSL 0:9d17e4342598 1947 int mp_read_unsigned_bin (mp_int * a, const unsigned char *b, int c)
wolfSSL 0:9d17e4342598 1948 {
wolfSSL 0:9d17e4342598 1949 fp_read_unsigned_bin(a, (unsigned char *)b, c);
wolfSSL 0:9d17e4342598 1950 return MP_OKAY;
wolfSSL 0:9d17e4342598 1951 }
wolfSSL 0:9d17e4342598 1952
wolfSSL 0:9d17e4342598 1953
wolfSSL 0:9d17e4342598 1954 int mp_sub_d(fp_int *a, fp_digit b, fp_int *c)
wolfSSL 0:9d17e4342598 1955 {
wolfSSL 0:9d17e4342598 1956 fp_sub_d(a, b, c);
wolfSSL 0:9d17e4342598 1957 return MP_OKAY;
wolfSSL 0:9d17e4342598 1958 }
wolfSSL 0:9d17e4342598 1959
wolfSSL 0:9d17e4342598 1960
wolfSSL 0:9d17e4342598 1961 /* fast math conversion */
wolfSSL 0:9d17e4342598 1962 int mp_copy(fp_int* a, fp_int* b)
wolfSSL 0:9d17e4342598 1963 {
wolfSSL 0:9d17e4342598 1964 fp_copy(a, b);
wolfSSL 0:9d17e4342598 1965 return MP_OKAY;
wolfSSL 0:9d17e4342598 1966 }
wolfSSL 0:9d17e4342598 1967
wolfSSL 0:9d17e4342598 1968
wolfSSL 0:9d17e4342598 1969 /* fast math conversion */
wolfSSL 0:9d17e4342598 1970 int mp_isodd(mp_int* a)
wolfSSL 0:9d17e4342598 1971 {
wolfSSL 0:9d17e4342598 1972 return fp_isodd(a);
wolfSSL 0:9d17e4342598 1973 }
wolfSSL 0:9d17e4342598 1974
wolfSSL 0:9d17e4342598 1975
wolfSSL 0:9d17e4342598 1976 /* fast math conversion */
wolfSSL 0:9d17e4342598 1977 int mp_iszero(mp_int* a)
wolfSSL 0:9d17e4342598 1978 {
wolfSSL 0:9d17e4342598 1979 return fp_iszero(a);
wolfSSL 0:9d17e4342598 1980 }
wolfSSL 0:9d17e4342598 1981
wolfSSL 0:9d17e4342598 1982
wolfSSL 0:9d17e4342598 1983 /* fast math conversion */
wolfSSL 0:9d17e4342598 1984 int mp_count_bits (mp_int* a)
wolfSSL 0:9d17e4342598 1985 {
wolfSSL 0:9d17e4342598 1986 return fp_count_bits(a);
wolfSSL 0:9d17e4342598 1987 }
wolfSSL 0:9d17e4342598 1988
wolfSSL 0:9d17e4342598 1989
wolfSSL 0:9d17e4342598 1990 int mp_leading_bit (mp_int* a)
wolfSSL 0:9d17e4342598 1991 {
wolfSSL 0:9d17e4342598 1992 return fp_leading_bit(a);
wolfSSL 0:9d17e4342598 1993 }
wolfSSL 0:9d17e4342598 1994
wolfSSL 0:9d17e4342598 1995
wolfSSL 0:9d17e4342598 1996 /* fast math conversion */
wolfSSL 0:9d17e4342598 1997 void mp_rshb (mp_int* a, int x)
wolfSSL 0:9d17e4342598 1998 {
wolfSSL 0:9d17e4342598 1999 fp_rshb(a, x);
wolfSSL 0:9d17e4342598 2000 }
wolfSSL 0:9d17e4342598 2001
wolfSSL 0:9d17e4342598 2002
wolfSSL 0:9d17e4342598 2003 /* fast math wrappers */
wolfSSL 0:9d17e4342598 2004 int mp_set_int(fp_int *a, fp_digit b)
wolfSSL 0:9d17e4342598 2005 {
wolfSSL 0:9d17e4342598 2006 fp_set(a, b);
wolfSSL 0:9d17e4342598 2007 return MP_OKAY;
wolfSSL 0:9d17e4342598 2008 }
wolfSSL 0:9d17e4342598 2009
wolfSSL 0:9d17e4342598 2010
wolfSSL 0:9d17e4342598 2011 #if defined(CYASSL_KEY_GEN) || defined (HAVE_ECC)
wolfSSL 0:9d17e4342598 2012
wolfSSL 0:9d17e4342598 2013 /* c = a * a (mod b) */
wolfSSL 0:9d17e4342598 2014 int fp_sqrmod(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 2015 {
wolfSSL 0:9d17e4342598 2016 fp_int tmp;
wolfSSL 0:9d17e4342598 2017 fp_zero(&tmp);
wolfSSL 0:9d17e4342598 2018 fp_sqr(a, &tmp);
wolfSSL 0:9d17e4342598 2019 return fp_mod(&tmp, b, c);
wolfSSL 0:9d17e4342598 2020 }
wolfSSL 0:9d17e4342598 2021
wolfSSL 0:9d17e4342598 2022 /* fast math conversion */
wolfSSL 0:9d17e4342598 2023 int mp_sqrmod(mp_int *a, mp_int *b, mp_int *c)
wolfSSL 0:9d17e4342598 2024 {
wolfSSL 0:9d17e4342598 2025 return fp_sqrmod(a, b, c);
wolfSSL 0:9d17e4342598 2026 }
wolfSSL 0:9d17e4342598 2027
wolfSSL 0:9d17e4342598 2028 /* fast math conversion */
wolfSSL 0:9d17e4342598 2029 int mp_montgomery_calc_normalization(mp_int *a, mp_int *b)
wolfSSL 0:9d17e4342598 2030 {
wolfSSL 0:9d17e4342598 2031 fp_montgomery_calc_normalization(a, b);
wolfSSL 0:9d17e4342598 2032 return MP_OKAY;
wolfSSL 0:9d17e4342598 2033 }
wolfSSL 0:9d17e4342598 2034
wolfSSL 0:9d17e4342598 2035 #endif /* CYASSL_KEYGEN || HAVE_ECC */
wolfSSL 0:9d17e4342598 2036
wolfSSL 0:9d17e4342598 2037
wolfSSL 0:9d17e4342598 2038 #ifdef CYASSL_KEY_GEN
wolfSSL 0:9d17e4342598 2039
wolfSSL 0:9d17e4342598 2040 void fp_gcd(fp_int *a, fp_int *b, fp_int *c);
wolfSSL 0:9d17e4342598 2041 void fp_lcm(fp_int *a, fp_int *b, fp_int *c);
wolfSSL 0:9d17e4342598 2042 int fp_isprime(fp_int *a);
wolfSSL 0:9d17e4342598 2043 int fp_cnt_lsb(fp_int *a);
wolfSSL 0:9d17e4342598 2044
wolfSSL 0:9d17e4342598 2045 int mp_gcd(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 2046 {
wolfSSL 0:9d17e4342598 2047 fp_gcd(a, b, c);
wolfSSL 0:9d17e4342598 2048 return MP_OKAY;
wolfSSL 0:9d17e4342598 2049 }
wolfSSL 0:9d17e4342598 2050
wolfSSL 0:9d17e4342598 2051
wolfSSL 0:9d17e4342598 2052 int mp_lcm(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 2053 {
wolfSSL 0:9d17e4342598 2054 fp_lcm(a, b, c);
wolfSSL 0:9d17e4342598 2055 return MP_OKAY;
wolfSSL 0:9d17e4342598 2056 }
wolfSSL 0:9d17e4342598 2057
wolfSSL 0:9d17e4342598 2058
wolfSSL 0:9d17e4342598 2059 int mp_prime_is_prime(mp_int* a, int t, int* result)
wolfSSL 0:9d17e4342598 2060 {
wolfSSL 0:9d17e4342598 2061 (void)t;
wolfSSL 0:9d17e4342598 2062 *result = fp_isprime(a);
wolfSSL 0:9d17e4342598 2063 return MP_OKAY;
wolfSSL 0:9d17e4342598 2064 }
wolfSSL 0:9d17e4342598 2065
wolfSSL 0:9d17e4342598 2066
wolfSSL 0:9d17e4342598 2067
wolfSSL 0:9d17e4342598 2068 static int s_is_power_of_two(fp_digit b, int *p)
wolfSSL 0:9d17e4342598 2069 {
wolfSSL 0:9d17e4342598 2070 int x;
wolfSSL 0:9d17e4342598 2071
wolfSSL 0:9d17e4342598 2072 /* fast return if no power of two */
wolfSSL 0:9d17e4342598 2073 if ((b==0) || (b & (b-1))) {
wolfSSL 0:9d17e4342598 2074 return 0;
wolfSSL 0:9d17e4342598 2075 }
wolfSSL 0:9d17e4342598 2076
wolfSSL 0:9d17e4342598 2077 for (x = 0; x < DIGIT_BIT; x++) {
wolfSSL 0:9d17e4342598 2078 if (b == (((fp_digit)1)<<x)) {
wolfSSL 0:9d17e4342598 2079 *p = x;
wolfSSL 0:9d17e4342598 2080 return 1;
wolfSSL 0:9d17e4342598 2081 }
wolfSSL 0:9d17e4342598 2082 }
wolfSSL 0:9d17e4342598 2083 return 0;
wolfSSL 0:9d17e4342598 2084 }
wolfSSL 0:9d17e4342598 2085
wolfSSL 0:9d17e4342598 2086 /* a/b => cb + d == a */
wolfSSL 0:9d17e4342598 2087 static int fp_div_d(fp_int *a, fp_digit b, fp_int *c, fp_digit *d)
wolfSSL 0:9d17e4342598 2088 {
wolfSSL 0:9d17e4342598 2089 fp_int q;
wolfSSL 0:9d17e4342598 2090 fp_word w;
wolfSSL 0:9d17e4342598 2091 fp_digit t;
wolfSSL 0:9d17e4342598 2092 int ix;
wolfSSL 0:9d17e4342598 2093
wolfSSL 0:9d17e4342598 2094 /* cannot divide by zero */
wolfSSL 0:9d17e4342598 2095 if (b == 0) {
wolfSSL 0:9d17e4342598 2096 return FP_VAL;
wolfSSL 0:9d17e4342598 2097 }
wolfSSL 0:9d17e4342598 2098
wolfSSL 0:9d17e4342598 2099 /* quick outs */
wolfSSL 0:9d17e4342598 2100 if (b == 1 || fp_iszero(a) == 1) {
wolfSSL 0:9d17e4342598 2101 if (d != NULL) {
wolfSSL 0:9d17e4342598 2102 *d = 0;
wolfSSL 0:9d17e4342598 2103 }
wolfSSL 0:9d17e4342598 2104 if (c != NULL) {
wolfSSL 0:9d17e4342598 2105 fp_copy(a, c);
wolfSSL 0:9d17e4342598 2106 }
wolfSSL 0:9d17e4342598 2107 return FP_OKAY;
wolfSSL 0:9d17e4342598 2108 }
wolfSSL 0:9d17e4342598 2109
wolfSSL 0:9d17e4342598 2110 /* power of two ? */
wolfSSL 0:9d17e4342598 2111 if (s_is_power_of_two(b, &ix) == 1) {
wolfSSL 0:9d17e4342598 2112 if (d != NULL) {
wolfSSL 0:9d17e4342598 2113 *d = a->dp[0] & ((((fp_digit)1)<<ix) - 1);
wolfSSL 0:9d17e4342598 2114 }
wolfSSL 0:9d17e4342598 2115 if (c != NULL) {
wolfSSL 0:9d17e4342598 2116 fp_div_2d(a, ix, c, NULL);
wolfSSL 0:9d17e4342598 2117 }
wolfSSL 0:9d17e4342598 2118 return FP_OKAY;
wolfSSL 0:9d17e4342598 2119 }
wolfSSL 0:9d17e4342598 2120
wolfSSL 0:9d17e4342598 2121 /* no easy answer [c'est la vie]. Just division */
wolfSSL 0:9d17e4342598 2122 fp_init(&q);
wolfSSL 0:9d17e4342598 2123
wolfSSL 0:9d17e4342598 2124 q.used = a->used;
wolfSSL 0:9d17e4342598 2125 q.sign = a->sign;
wolfSSL 0:9d17e4342598 2126 w = 0;
wolfSSL 0:9d17e4342598 2127 for (ix = a->used - 1; ix >= 0; ix--) {
wolfSSL 0:9d17e4342598 2128 w = (w << ((fp_word)DIGIT_BIT)) | ((fp_word)a->dp[ix]);
wolfSSL 0:9d17e4342598 2129
wolfSSL 0:9d17e4342598 2130 if (w >= b) {
wolfSSL 0:9d17e4342598 2131 t = (fp_digit)(w / b);
wolfSSL 0:9d17e4342598 2132 w -= ((fp_word)t) * ((fp_word)b);
wolfSSL 0:9d17e4342598 2133 } else {
wolfSSL 0:9d17e4342598 2134 t = 0;
wolfSSL 0:9d17e4342598 2135 }
wolfSSL 0:9d17e4342598 2136 q.dp[ix] = (fp_digit)t;
wolfSSL 0:9d17e4342598 2137 }
wolfSSL 0:9d17e4342598 2138
wolfSSL 0:9d17e4342598 2139 if (d != NULL) {
wolfSSL 0:9d17e4342598 2140 *d = (fp_digit)w;
wolfSSL 0:9d17e4342598 2141 }
wolfSSL 0:9d17e4342598 2142
wolfSSL 0:9d17e4342598 2143 if (c != NULL) {
wolfSSL 0:9d17e4342598 2144 fp_clamp(&q);
wolfSSL 0:9d17e4342598 2145 fp_copy(&q, c);
wolfSSL 0:9d17e4342598 2146 }
wolfSSL 0:9d17e4342598 2147
wolfSSL 0:9d17e4342598 2148 return FP_OKAY;
wolfSSL 0:9d17e4342598 2149 }
wolfSSL 0:9d17e4342598 2150
wolfSSL 0:9d17e4342598 2151
wolfSSL 0:9d17e4342598 2152 /* c = a mod b, 0 <= c < b */
wolfSSL 0:9d17e4342598 2153 static int fp_mod_d(fp_int *a, fp_digit b, fp_digit *c)
wolfSSL 0:9d17e4342598 2154 {
wolfSSL 0:9d17e4342598 2155 return fp_div_d(a, b, NULL, c);
wolfSSL 0:9d17e4342598 2156 }
wolfSSL 0:9d17e4342598 2157
wolfSSL 0:9d17e4342598 2158
wolfSSL 0:9d17e4342598 2159 /* Miller-Rabin test of "a" to the base of "b" as described in
wolfSSL 0:9d17e4342598 2160 * HAC pp. 139 Algorithm 4.24
wolfSSL 0:9d17e4342598 2161 *
wolfSSL 0:9d17e4342598 2162 * Sets result to 0 if definitely composite or 1 if probably prime.
wolfSSL 0:9d17e4342598 2163 * Randomly the chance of error is no more than 1/4 and often
wolfSSL 0:9d17e4342598 2164 * very much lower.
wolfSSL 0:9d17e4342598 2165 */
wolfSSL 0:9d17e4342598 2166 static void fp_prime_miller_rabin (fp_int * a, fp_int * b, int *result)
wolfSSL 0:9d17e4342598 2167 {
wolfSSL 0:9d17e4342598 2168 fp_int n1, y, r;
wolfSSL 0:9d17e4342598 2169 int s, j;
wolfSSL 0:9d17e4342598 2170
wolfSSL 0:9d17e4342598 2171 /* default */
wolfSSL 0:9d17e4342598 2172 *result = FP_NO;
wolfSSL 0:9d17e4342598 2173
wolfSSL 0:9d17e4342598 2174 /* ensure b > 1 */
wolfSSL 0:9d17e4342598 2175 if (fp_cmp_d(b, 1) != FP_GT) {
wolfSSL 0:9d17e4342598 2176 return;
wolfSSL 0:9d17e4342598 2177 }
wolfSSL 0:9d17e4342598 2178
wolfSSL 0:9d17e4342598 2179 /* get n1 = a - 1 */
wolfSSL 0:9d17e4342598 2180 fp_init_copy(&n1, a);
wolfSSL 0:9d17e4342598 2181 fp_sub_d(&n1, 1, &n1);
wolfSSL 0:9d17e4342598 2182
wolfSSL 0:9d17e4342598 2183 /* set 2**s * r = n1 */
wolfSSL 0:9d17e4342598 2184 fp_init_copy(&r, &n1);
wolfSSL 0:9d17e4342598 2185
wolfSSL 0:9d17e4342598 2186 /* count the number of least significant bits
wolfSSL 0:9d17e4342598 2187 * which are zero
wolfSSL 0:9d17e4342598 2188 */
wolfSSL 0:9d17e4342598 2189 s = fp_cnt_lsb(&r);
wolfSSL 0:9d17e4342598 2190
wolfSSL 0:9d17e4342598 2191 /* now divide n - 1 by 2**s */
wolfSSL 0:9d17e4342598 2192 fp_div_2d (&r, s, &r, NULL);
wolfSSL 0:9d17e4342598 2193
wolfSSL 0:9d17e4342598 2194 /* compute y = b**r mod a */
wolfSSL 0:9d17e4342598 2195 fp_init(&y);
wolfSSL 0:9d17e4342598 2196 fp_exptmod(b, &r, a, &y);
wolfSSL 0:9d17e4342598 2197
wolfSSL 0:9d17e4342598 2198 /* if y != 1 and y != n1 do */
wolfSSL 0:9d17e4342598 2199 if (fp_cmp_d (&y, 1) != FP_EQ && fp_cmp (&y, &n1) != FP_EQ) {
wolfSSL 0:9d17e4342598 2200 j = 1;
wolfSSL 0:9d17e4342598 2201 /* while j <= s-1 and y != n1 */
wolfSSL 0:9d17e4342598 2202 while ((j <= (s - 1)) && fp_cmp (&y, &n1) != FP_EQ) {
wolfSSL 0:9d17e4342598 2203 fp_sqrmod (&y, a, &y);
wolfSSL 0:9d17e4342598 2204
wolfSSL 0:9d17e4342598 2205 /* if y == 1 then composite */
wolfSSL 0:9d17e4342598 2206 if (fp_cmp_d (&y, 1) == FP_EQ) {
wolfSSL 0:9d17e4342598 2207 return;
wolfSSL 0:9d17e4342598 2208 }
wolfSSL 0:9d17e4342598 2209 ++j;
wolfSSL 0:9d17e4342598 2210 }
wolfSSL 0:9d17e4342598 2211
wolfSSL 0:9d17e4342598 2212 /* if y != n1 then composite */
wolfSSL 0:9d17e4342598 2213 if (fp_cmp (&y, &n1) != FP_EQ) {
wolfSSL 0:9d17e4342598 2214 return;
wolfSSL 0:9d17e4342598 2215 }
wolfSSL 0:9d17e4342598 2216 }
wolfSSL 0:9d17e4342598 2217
wolfSSL 0:9d17e4342598 2218 /* probably prime now */
wolfSSL 0:9d17e4342598 2219 *result = FP_YES;
wolfSSL 0:9d17e4342598 2220 }
wolfSSL 0:9d17e4342598 2221
wolfSSL 0:9d17e4342598 2222
wolfSSL 0:9d17e4342598 2223 /* a few primes */
wolfSSL 0:9d17e4342598 2224 static const fp_digit primes[256] = {
wolfSSL 0:9d17e4342598 2225 0x0002, 0x0003, 0x0005, 0x0007, 0x000B, 0x000D, 0x0011, 0x0013,
wolfSSL 0:9d17e4342598 2226 0x0017, 0x001D, 0x001F, 0x0025, 0x0029, 0x002B, 0x002F, 0x0035,
wolfSSL 0:9d17e4342598 2227 0x003B, 0x003D, 0x0043, 0x0047, 0x0049, 0x004F, 0x0053, 0x0059,
wolfSSL 0:9d17e4342598 2228 0x0061, 0x0065, 0x0067, 0x006B, 0x006D, 0x0071, 0x007F, 0x0083,
wolfSSL 0:9d17e4342598 2229 0x0089, 0x008B, 0x0095, 0x0097, 0x009D, 0x00A3, 0x00A7, 0x00AD,
wolfSSL 0:9d17e4342598 2230 0x00B3, 0x00B5, 0x00BF, 0x00C1, 0x00C5, 0x00C7, 0x00D3, 0x00DF,
wolfSSL 0:9d17e4342598 2231 0x00E3, 0x00E5, 0x00E9, 0x00EF, 0x00F1, 0x00FB, 0x0101, 0x0107,
wolfSSL 0:9d17e4342598 2232 0x010D, 0x010F, 0x0115, 0x0119, 0x011B, 0x0125, 0x0133, 0x0137,
wolfSSL 0:9d17e4342598 2233
wolfSSL 0:9d17e4342598 2234 0x0139, 0x013D, 0x014B, 0x0151, 0x015B, 0x015D, 0x0161, 0x0167,
wolfSSL 0:9d17e4342598 2235 0x016F, 0x0175, 0x017B, 0x017F, 0x0185, 0x018D, 0x0191, 0x0199,
wolfSSL 0:9d17e4342598 2236 0x01A3, 0x01A5, 0x01AF, 0x01B1, 0x01B7, 0x01BB, 0x01C1, 0x01C9,
wolfSSL 0:9d17e4342598 2237 0x01CD, 0x01CF, 0x01D3, 0x01DF, 0x01E7, 0x01EB, 0x01F3, 0x01F7,
wolfSSL 0:9d17e4342598 2238 0x01FD, 0x0209, 0x020B, 0x021D, 0x0223, 0x022D, 0x0233, 0x0239,
wolfSSL 0:9d17e4342598 2239 0x023B, 0x0241, 0x024B, 0x0251, 0x0257, 0x0259, 0x025F, 0x0265,
wolfSSL 0:9d17e4342598 2240 0x0269, 0x026B, 0x0277, 0x0281, 0x0283, 0x0287, 0x028D, 0x0293,
wolfSSL 0:9d17e4342598 2241 0x0295, 0x02A1, 0x02A5, 0x02AB, 0x02B3, 0x02BD, 0x02C5, 0x02CF,
wolfSSL 0:9d17e4342598 2242
wolfSSL 0:9d17e4342598 2243 0x02D7, 0x02DD, 0x02E3, 0x02E7, 0x02EF, 0x02F5, 0x02F9, 0x0301,
wolfSSL 0:9d17e4342598 2244 0x0305, 0x0313, 0x031D, 0x0329, 0x032B, 0x0335, 0x0337, 0x033B,
wolfSSL 0:9d17e4342598 2245 0x033D, 0x0347, 0x0355, 0x0359, 0x035B, 0x035F, 0x036D, 0x0371,
wolfSSL 0:9d17e4342598 2246 0x0373, 0x0377, 0x038B, 0x038F, 0x0397, 0x03A1, 0x03A9, 0x03AD,
wolfSSL 0:9d17e4342598 2247 0x03B3, 0x03B9, 0x03C7, 0x03CB, 0x03D1, 0x03D7, 0x03DF, 0x03E5,
wolfSSL 0:9d17e4342598 2248 0x03F1, 0x03F5, 0x03FB, 0x03FD, 0x0407, 0x0409, 0x040F, 0x0419,
wolfSSL 0:9d17e4342598 2249 0x041B, 0x0425, 0x0427, 0x042D, 0x043F, 0x0443, 0x0445, 0x0449,
wolfSSL 0:9d17e4342598 2250 0x044F, 0x0455, 0x045D, 0x0463, 0x0469, 0x047F, 0x0481, 0x048B,
wolfSSL 0:9d17e4342598 2251
wolfSSL 0:9d17e4342598 2252 0x0493, 0x049D, 0x04A3, 0x04A9, 0x04B1, 0x04BD, 0x04C1, 0x04C7,
wolfSSL 0:9d17e4342598 2253 0x04CD, 0x04CF, 0x04D5, 0x04E1, 0x04EB, 0x04FD, 0x04FF, 0x0503,
wolfSSL 0:9d17e4342598 2254 0x0509, 0x050B, 0x0511, 0x0515, 0x0517, 0x051B, 0x0527, 0x0529,
wolfSSL 0:9d17e4342598 2255 0x052F, 0x0551, 0x0557, 0x055D, 0x0565, 0x0577, 0x0581, 0x058F,
wolfSSL 0:9d17e4342598 2256 0x0593, 0x0595, 0x0599, 0x059F, 0x05A7, 0x05AB, 0x05AD, 0x05B3,
wolfSSL 0:9d17e4342598 2257 0x05BF, 0x05C9, 0x05CB, 0x05CF, 0x05D1, 0x05D5, 0x05DB, 0x05E7,
wolfSSL 0:9d17e4342598 2258 0x05F3, 0x05FB, 0x0607, 0x060D, 0x0611, 0x0617, 0x061F, 0x0623,
wolfSSL 0:9d17e4342598 2259 0x062B, 0x062F, 0x063D, 0x0641, 0x0647, 0x0649, 0x064D, 0x0653
wolfSSL 0:9d17e4342598 2260 };
wolfSSL 0:9d17e4342598 2261
wolfSSL 0:9d17e4342598 2262 int fp_isprime(fp_int *a)
wolfSSL 0:9d17e4342598 2263 {
wolfSSL 0:9d17e4342598 2264 fp_int b;
wolfSSL 0:9d17e4342598 2265 fp_digit d = 0;
wolfSSL 0:9d17e4342598 2266 int r, res;
wolfSSL 0:9d17e4342598 2267
wolfSSL 0:9d17e4342598 2268 /* do trial division */
wolfSSL 0:9d17e4342598 2269 for (r = 0; r < 256; r++) {
wolfSSL 0:9d17e4342598 2270 fp_mod_d(a, primes[r], &d);
wolfSSL 0:9d17e4342598 2271 if (d == 0) {
wolfSSL 0:9d17e4342598 2272 return FP_NO;
wolfSSL 0:9d17e4342598 2273 }
wolfSSL 0:9d17e4342598 2274 }
wolfSSL 0:9d17e4342598 2275
wolfSSL 0:9d17e4342598 2276 /* now do 8 miller rabins */
wolfSSL 0:9d17e4342598 2277 fp_init(&b);
wolfSSL 0:9d17e4342598 2278 for (r = 0; r < 8; r++) {
wolfSSL 0:9d17e4342598 2279 fp_set(&b, primes[r]);
wolfSSL 0:9d17e4342598 2280 fp_prime_miller_rabin(a, &b, &res);
wolfSSL 0:9d17e4342598 2281 if (res == FP_NO) {
wolfSSL 0:9d17e4342598 2282 return FP_NO;
wolfSSL 0:9d17e4342598 2283 }
wolfSSL 0:9d17e4342598 2284 }
wolfSSL 0:9d17e4342598 2285 return FP_YES;
wolfSSL 0:9d17e4342598 2286 }
wolfSSL 0:9d17e4342598 2287
wolfSSL 0:9d17e4342598 2288
wolfSSL 0:9d17e4342598 2289 /* c = [a, b] */
wolfSSL 0:9d17e4342598 2290 void fp_lcm(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 2291 {
wolfSSL 0:9d17e4342598 2292 fp_int t1, t2;
wolfSSL 0:9d17e4342598 2293
wolfSSL 0:9d17e4342598 2294 fp_init(&t1);
wolfSSL 0:9d17e4342598 2295 fp_init(&t2);
wolfSSL 0:9d17e4342598 2296 fp_gcd(a, b, &t1);
wolfSSL 0:9d17e4342598 2297 if (fp_cmp_mag(a, b) == FP_GT) {
wolfSSL 0:9d17e4342598 2298 fp_div(a, &t1, &t2, NULL);
wolfSSL 0:9d17e4342598 2299 fp_mul(b, &t2, c);
wolfSSL 0:9d17e4342598 2300 } else {
wolfSSL 0:9d17e4342598 2301 fp_div(b, &t1, &t2, NULL);
wolfSSL 0:9d17e4342598 2302 fp_mul(a, &t2, c);
wolfSSL 0:9d17e4342598 2303 }
wolfSSL 0:9d17e4342598 2304 }
wolfSSL 0:9d17e4342598 2305
wolfSSL 0:9d17e4342598 2306
wolfSSL 0:9d17e4342598 2307 static const int lnz[16] = {
wolfSSL 0:9d17e4342598 2308 4, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0
wolfSSL 0:9d17e4342598 2309 };
wolfSSL 0:9d17e4342598 2310
wolfSSL 0:9d17e4342598 2311 /* Counts the number of lsbs which are zero before the first zero bit */
wolfSSL 0:9d17e4342598 2312 int fp_cnt_lsb(fp_int *a)
wolfSSL 0:9d17e4342598 2313 {
wolfSSL 0:9d17e4342598 2314 int x;
wolfSSL 0:9d17e4342598 2315 fp_digit q, qq;
wolfSSL 0:9d17e4342598 2316
wolfSSL 0:9d17e4342598 2317 /* easy out */
wolfSSL 0:9d17e4342598 2318 if (fp_iszero(a) == 1) {
wolfSSL 0:9d17e4342598 2319 return 0;
wolfSSL 0:9d17e4342598 2320 }
wolfSSL 0:9d17e4342598 2321
wolfSSL 0:9d17e4342598 2322 /* scan lower digits until non-zero */
wolfSSL 0:9d17e4342598 2323 for (x = 0; x < a->used && a->dp[x] == 0; x++);
wolfSSL 0:9d17e4342598 2324 q = a->dp[x];
wolfSSL 0:9d17e4342598 2325 x *= DIGIT_BIT;
wolfSSL 0:9d17e4342598 2326
wolfSSL 0:9d17e4342598 2327 /* now scan this digit until a 1 is found */
wolfSSL 0:9d17e4342598 2328 if ((q & 1) == 0) {
wolfSSL 0:9d17e4342598 2329 do {
wolfSSL 0:9d17e4342598 2330 qq = q & 15;
wolfSSL 0:9d17e4342598 2331 x += lnz[qq];
wolfSSL 0:9d17e4342598 2332 q >>= 4;
wolfSSL 0:9d17e4342598 2333 } while (qq == 0);
wolfSSL 0:9d17e4342598 2334 }
wolfSSL 0:9d17e4342598 2335 return x;
wolfSSL 0:9d17e4342598 2336 }
wolfSSL 0:9d17e4342598 2337
wolfSSL 0:9d17e4342598 2338
wolfSSL 0:9d17e4342598 2339 /* c = (a, b) */
wolfSSL 0:9d17e4342598 2340 void fp_gcd(fp_int *a, fp_int *b, fp_int *c)
wolfSSL 0:9d17e4342598 2341 {
wolfSSL 0:9d17e4342598 2342 fp_int u, v, r;
wolfSSL 0:9d17e4342598 2343
wolfSSL 0:9d17e4342598 2344 /* either zero than gcd is the largest */
wolfSSL 0:9d17e4342598 2345 if (fp_iszero (a) == 1 && fp_iszero (b) == 0) {
wolfSSL 0:9d17e4342598 2346 fp_abs (b, c);
wolfSSL 0:9d17e4342598 2347 return;
wolfSSL 0:9d17e4342598 2348 }
wolfSSL 0:9d17e4342598 2349 if (fp_iszero (a) == 0 && fp_iszero (b) == 1) {
wolfSSL 0:9d17e4342598 2350 fp_abs (a, c);
wolfSSL 0:9d17e4342598 2351 return;
wolfSSL 0:9d17e4342598 2352 }
wolfSSL 0:9d17e4342598 2353
wolfSSL 0:9d17e4342598 2354 /* optimized. At this point if a == 0 then
wolfSSL 0:9d17e4342598 2355 * b must equal zero too
wolfSSL 0:9d17e4342598 2356 */
wolfSSL 0:9d17e4342598 2357 if (fp_iszero (a) == 1) {
wolfSSL 0:9d17e4342598 2358 fp_zero(c);
wolfSSL 0:9d17e4342598 2359 return;
wolfSSL 0:9d17e4342598 2360 }
wolfSSL 0:9d17e4342598 2361
wolfSSL 0:9d17e4342598 2362 /* sort inputs */
wolfSSL 0:9d17e4342598 2363 if (fp_cmp_mag(a, b) != FP_LT) {
wolfSSL 0:9d17e4342598 2364 fp_init_copy(&u, a);
wolfSSL 0:9d17e4342598 2365 fp_init_copy(&v, b);
wolfSSL 0:9d17e4342598 2366 } else {
wolfSSL 0:9d17e4342598 2367 fp_init_copy(&u, b);
wolfSSL 0:9d17e4342598 2368 fp_init_copy(&v, a);
wolfSSL 0:9d17e4342598 2369 }
wolfSSL 0:9d17e4342598 2370
wolfSSL 0:9d17e4342598 2371 fp_zero(&r);
wolfSSL 0:9d17e4342598 2372 while (fp_iszero(&v) == FP_NO) {
wolfSSL 0:9d17e4342598 2373 fp_mod(&u, &v, &r);
wolfSSL 0:9d17e4342598 2374 fp_copy(&v, &u);
wolfSSL 0:9d17e4342598 2375 fp_copy(&r, &v);
wolfSSL 0:9d17e4342598 2376 }
wolfSSL 0:9d17e4342598 2377 fp_copy(&u, c);
wolfSSL 0:9d17e4342598 2378 }
wolfSSL 0:9d17e4342598 2379
wolfSSL 0:9d17e4342598 2380 #endif /* CYASSL_KEY_GEN */
wolfSSL 0:9d17e4342598 2381
wolfSSL 0:9d17e4342598 2382
wolfSSL 0:9d17e4342598 2383 #if defined(HAVE_ECC) || !defined(NO_PWDBASED)
wolfSSL 0:9d17e4342598 2384 /* c = a + b */
wolfSSL 0:9d17e4342598 2385 void fp_add_d(fp_int *a, fp_digit b, fp_int *c)
wolfSSL 0:9d17e4342598 2386 {
wolfSSL 0:9d17e4342598 2387 fp_int tmp;
wolfSSL 0:9d17e4342598 2388 fp_set(&tmp, b);
wolfSSL 0:9d17e4342598 2389 fp_add(a,&tmp,c);
wolfSSL 0:9d17e4342598 2390 }
wolfSSL 0:9d17e4342598 2391
wolfSSL 0:9d17e4342598 2392 /* external compatibility */
wolfSSL 0:9d17e4342598 2393 int mp_add_d(fp_int *a, fp_digit b, fp_int *c)
wolfSSL 0:9d17e4342598 2394 {
wolfSSL 0:9d17e4342598 2395 fp_add_d(a, b, c);
wolfSSL 0:9d17e4342598 2396 return MP_OKAY;
wolfSSL 0:9d17e4342598 2397 }
wolfSSL 0:9d17e4342598 2398
wolfSSL 0:9d17e4342598 2399 #endif /* HAVE_ECC || !NO_PWDBASED */
wolfSSL 0:9d17e4342598 2400
wolfSSL 0:9d17e4342598 2401
wolfSSL 0:9d17e4342598 2402 #ifdef HAVE_ECC
wolfSSL 0:9d17e4342598 2403
wolfSSL 0:9d17e4342598 2404 /* chars used in radix conversions */
wolfSSL 0:9d17e4342598 2405 static const char *fp_s_rmap = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz+/";
wolfSSL 0:9d17e4342598 2406
wolfSSL 0:9d17e4342598 2407 static int fp_read_radix(fp_int *a, const char *str, int radix)
wolfSSL 0:9d17e4342598 2408 {
wolfSSL 0:9d17e4342598 2409 int y, neg;
wolfSSL 0:9d17e4342598 2410 char ch;
wolfSSL 0:9d17e4342598 2411
wolfSSL 0:9d17e4342598 2412 /* make sure the radix is ok */
wolfSSL 0:9d17e4342598 2413 if (radix < 2 || radix > 64) {
wolfSSL 0:9d17e4342598 2414 return FP_VAL;
wolfSSL 0:9d17e4342598 2415 }
wolfSSL 0:9d17e4342598 2416
wolfSSL 0:9d17e4342598 2417 /* if the leading digit is a
wolfSSL 0:9d17e4342598 2418 * minus set the sign to negative.
wolfSSL 0:9d17e4342598 2419 */
wolfSSL 0:9d17e4342598 2420 if (*str == '-') {
wolfSSL 0:9d17e4342598 2421 ++str;
wolfSSL 0:9d17e4342598 2422 neg = FP_NEG;
wolfSSL 0:9d17e4342598 2423 } else {
wolfSSL 0:9d17e4342598 2424 neg = FP_ZPOS;
wolfSSL 0:9d17e4342598 2425 }
wolfSSL 0:9d17e4342598 2426
wolfSSL 0:9d17e4342598 2427 /* set the integer to the default of zero */
wolfSSL 0:9d17e4342598 2428 fp_zero (a);
wolfSSL 0:9d17e4342598 2429
wolfSSL 0:9d17e4342598 2430 /* process each digit of the string */
wolfSSL 0:9d17e4342598 2431 while (*str) {
wolfSSL 0:9d17e4342598 2432 /* if the radix < 36 the conversion is case insensitive
wolfSSL 0:9d17e4342598 2433 * this allows numbers like 1AB and 1ab to represent the same value
wolfSSL 0:9d17e4342598 2434 * [e.g. in hex]
wolfSSL 0:9d17e4342598 2435 */
wolfSSL 0:9d17e4342598 2436 ch = (char) ((radix < 36) ? XTOUPPER(*str) : *str);
wolfSSL 0:9d17e4342598 2437 for (y = 0; y < 64; y++) {
wolfSSL 0:9d17e4342598 2438 if (ch == fp_s_rmap[y]) {
wolfSSL 0:9d17e4342598 2439 break;
wolfSSL 0:9d17e4342598 2440 }
wolfSSL 0:9d17e4342598 2441 }
wolfSSL 0:9d17e4342598 2442
wolfSSL 0:9d17e4342598 2443 /* if the char was found in the map
wolfSSL 0:9d17e4342598 2444 * and is less than the given radix add it
wolfSSL 0:9d17e4342598 2445 * to the number, otherwise exit the loop.
wolfSSL 0:9d17e4342598 2446 */
wolfSSL 0:9d17e4342598 2447 if (y < radix) {
wolfSSL 0:9d17e4342598 2448 fp_mul_d (a, (fp_digit) radix, a);
wolfSSL 0:9d17e4342598 2449 fp_add_d (a, (fp_digit) y, a);
wolfSSL 0:9d17e4342598 2450 } else {
wolfSSL 0:9d17e4342598 2451 break;
wolfSSL 0:9d17e4342598 2452 }
wolfSSL 0:9d17e4342598 2453 ++str;
wolfSSL 0:9d17e4342598 2454 }
wolfSSL 0:9d17e4342598 2455
wolfSSL 0:9d17e4342598 2456 /* set the sign only if a != 0 */
wolfSSL 0:9d17e4342598 2457 if (fp_iszero(a) != FP_YES) {
wolfSSL 0:9d17e4342598 2458 a->sign = neg;
wolfSSL 0:9d17e4342598 2459 }
wolfSSL 0:9d17e4342598 2460 return FP_OKAY;
wolfSSL 0:9d17e4342598 2461 }
wolfSSL 0:9d17e4342598 2462
wolfSSL 0:9d17e4342598 2463 /* fast math conversion */
wolfSSL 0:9d17e4342598 2464 int mp_read_radix(mp_int *a, const char *str, int radix)
wolfSSL 0:9d17e4342598 2465 {
wolfSSL 0:9d17e4342598 2466 return fp_read_radix(a, str, radix);
wolfSSL 0:9d17e4342598 2467 }
wolfSSL 0:9d17e4342598 2468
wolfSSL 0:9d17e4342598 2469 /* fast math conversion */
wolfSSL 0:9d17e4342598 2470 int mp_set(fp_int *a, fp_digit b)
wolfSSL 0:9d17e4342598 2471 {
wolfSSL 0:9d17e4342598 2472 fp_set(a,b);
wolfSSL 0:9d17e4342598 2473 return MP_OKAY;
wolfSSL 0:9d17e4342598 2474 }
wolfSSL 0:9d17e4342598 2475
wolfSSL 0:9d17e4342598 2476 /* fast math conversion */
wolfSSL 0:9d17e4342598 2477 int mp_sqr(fp_int *A, fp_int *B)
wolfSSL 0:9d17e4342598 2478 {
wolfSSL 0:9d17e4342598 2479 fp_sqr(A, B);
wolfSSL 0:9d17e4342598 2480 return MP_OKAY;
wolfSSL 0:9d17e4342598 2481 }
wolfSSL 0:9d17e4342598 2482
wolfSSL 0:9d17e4342598 2483 /* fast math conversion */
wolfSSL 0:9d17e4342598 2484 int mp_montgomery_reduce(fp_int *a, fp_int *m, fp_digit mp)
wolfSSL 0:9d17e4342598 2485 {
wolfSSL 0:9d17e4342598 2486 fp_montgomery_reduce(a, m, mp);
wolfSSL 0:9d17e4342598 2487 return MP_OKAY;
wolfSSL 0:9d17e4342598 2488 }
wolfSSL 0:9d17e4342598 2489
wolfSSL 0:9d17e4342598 2490
wolfSSL 0:9d17e4342598 2491 /* fast math conversion */
wolfSSL 0:9d17e4342598 2492 int mp_montgomery_setup(fp_int *a, fp_digit *rho)
wolfSSL 0:9d17e4342598 2493 {
wolfSSL 0:9d17e4342598 2494 return fp_montgomery_setup(a, rho);
wolfSSL 0:9d17e4342598 2495 }
wolfSSL 0:9d17e4342598 2496
wolfSSL 0:9d17e4342598 2497 int mp_div_2(fp_int * a, fp_int * b)
wolfSSL 0:9d17e4342598 2498 {
wolfSSL 0:9d17e4342598 2499 fp_div_2(a, b);
wolfSSL 0:9d17e4342598 2500 return MP_OKAY;
wolfSSL 0:9d17e4342598 2501 }
wolfSSL 0:9d17e4342598 2502
wolfSSL 0:9d17e4342598 2503
wolfSSL 0:9d17e4342598 2504 int mp_init_copy(fp_int * a, fp_int * b)
wolfSSL 0:9d17e4342598 2505 {
wolfSSL 0:9d17e4342598 2506 fp_init_copy(a, b);
wolfSSL 0:9d17e4342598 2507 return MP_OKAY;
wolfSSL 0:9d17e4342598 2508 }
wolfSSL 0:9d17e4342598 2509
wolfSSL 0:9d17e4342598 2510
wolfSSL 0:9d17e4342598 2511
wolfSSL 0:9d17e4342598 2512 #endif /* HAVE_ECC */
wolfSSL 0:9d17e4342598 2513
wolfSSL 0:9d17e4342598 2514 #endif /* USE_FAST_MATH */