Subversion Repositories shark

Rev

Rev 3 | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
2 pj 1
/*
2
 * Copyright (c) 1997-1999 Massachusetts Institute of Technology
3
 *
4
 * This program is free software; you can redistribute it and/or modify
5
 * it under the terms of the GNU General Public License as published by
6
 * the Free Software Foundation; either version 2 of the License, or
7
 * (at your option) any later version.
8
 *
9
 * This program is distributed in the hope that it will be useful,
10
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
11
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12
 * GNU General Public License for more details.
13
 *
14
 * You should have received a copy of the GNU General Public License
15
 * along with this program; if not, write to the Free Software
16
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17
 *
18
 */
19
 
20
/* This file was automatically generated --- DO NOT EDIT */
21
/* Generated on Tue May 18 13:55:39 EDT 1999 */
22
 
107 pj 23
#include <fftw-int.h>
24
#include <fftw.h>
2 pj 25
 
26
/* Generated by: ./genfft -magic-alignment-check -magic-twiddle-load-all -magic-variables 4 -magic-loopi -hc2hc-forward 16 */
27
 
28
/*
29
 * This function contains 298 FP additions, 130 FP multiplications,
30
 * (or, 244 additions, 76 multiplications, 54 fused multiply/add),
31
 * 51 stack variables, and 128 memory accesses
32
 */
33
static const fftw_real K277785116 = FFTW_KONST(+0.277785116509801112371415406974266437187468595);
34
static const fftw_real K415734806 = FFTW_KONST(+0.415734806151272618539394188808952878369280406);
35
static const fftw_real K490392640 = FFTW_KONST(+0.490392640201615224563091118067119518486966865);
36
static const fftw_real K097545161 = FFTW_KONST(+0.097545161008064133924142434238511120463845809);
37
static const fftw_real K1_414213562 = FFTW_KONST(+1.414213562373095048801688724209698078569671875);
38
static const fftw_real K2_000000000 = FFTW_KONST(+2.000000000000000000000000000000000000000000000);
39
static const fftw_real K707106781 = FFTW_KONST(+0.707106781186547524400844362104849039284835938);
40
static const fftw_real K923879532 = FFTW_KONST(+0.923879532511286756128183189396788286822416626);
41
static const fftw_real K382683432 = FFTW_KONST(+0.382683432365089771728459984030398866761344562);
42
 
43
/*
44
 * Generator Id's :
107 pj 45
 * $Id: fhf_16.c,v 1.2 2003-03-24 11:14:57 pj Exp $
46
 * $Id: fhf_16.c,v 1.2 2003-03-24 11:14:57 pj Exp $
47
 * $Id: fhf_16.c,v 1.2 2003-03-24 11:14:57 pj Exp $
2 pj 48
 */
49
 
50
void fftw_hc2hc_forward_16(fftw_real *A, const fftw_complex *W, int iostride, int m, int dist)
51
{
52
     int i;
53
     fftw_real *X;
54
     fftw_real *Y;
55
     X = A;
56
     Y = A + (16 * iostride);
57
     {
58
          fftw_real tmp277;
59
          fftw_real tmp280;
60
          fftw_real tmp281;
61
          fftw_real tmp309;
62
          fftw_real tmp292;
63
          fftw_real tmp307;
64
          fftw_real tmp314;
65
          fftw_real tmp322;
66
          fftw_real tmp330;
67
          fftw_real tmp284;
68
          fftw_real tmp287;
69
          fftw_real tmp288;
70
          fftw_real tmp310;
71
          fftw_real tmp291;
72
          fftw_real tmp300;
73
          fftw_real tmp315;
74
          fftw_real tmp325;
75
          fftw_real tmp331;
76
          fftw_real tmp290;
77
          fftw_real tmp289;
78
          fftw_real tmp317;
79
          fftw_real tmp318;
80
          ASSERT_ALIGNED_DOUBLE();
81
          {
82
               fftw_real tmp275;
83
               fftw_real tmp276;
84
               fftw_real tmp278;
85
               fftw_real tmp279;
86
               ASSERT_ALIGNED_DOUBLE();
87
               tmp275 = X[0];
88
               tmp276 = X[8 * iostride];
89
               tmp277 = tmp275 + tmp276;
90
               tmp278 = X[4 * iostride];
91
               tmp279 = X[12 * iostride];
92
               tmp280 = tmp278 + tmp279;
93
               tmp281 = tmp277 + tmp280;
94
               tmp309 = tmp275 - tmp276;
95
               tmp292 = tmp278 - tmp279;
96
          }
97
          {
98
               fftw_real tmp303;
99
               fftw_real tmp320;
100
               fftw_real tmp306;
101
               fftw_real tmp321;
102
               ASSERT_ALIGNED_DOUBLE();
103
               {
104
                    fftw_real tmp301;
105
                    fftw_real tmp302;
106
                    fftw_real tmp304;
107
                    fftw_real tmp305;
108
                    ASSERT_ALIGNED_DOUBLE();
109
                    tmp301 = X[iostride];
110
                    tmp302 = X[9 * iostride];
111
                    tmp303 = tmp301 - tmp302;
112
                    tmp320 = tmp301 + tmp302;
113
                    tmp304 = X[5 * iostride];
114
                    tmp305 = X[13 * iostride];
115
                    tmp306 = tmp304 - tmp305;
116
                    tmp321 = tmp304 + tmp305;
117
               }
118
               tmp307 = (K382683432 * tmp303) + (K923879532 * tmp306);
119
               tmp314 = (K923879532 * tmp303) - (K382683432 * tmp306);
120
               tmp322 = tmp320 - tmp321;
121
               tmp330 = tmp320 + tmp321;
122
          }
123
          {
124
               fftw_real tmp282;
125
               fftw_real tmp283;
126
               fftw_real tmp285;
127
               fftw_real tmp286;
128
               ASSERT_ALIGNED_DOUBLE();
129
               tmp282 = X[2 * iostride];
130
               tmp283 = X[10 * iostride];
131
               tmp284 = tmp282 + tmp283;
132
               tmp290 = tmp282 - tmp283;
133
               tmp285 = X[14 * iostride];
134
               tmp286 = X[6 * iostride];
135
               tmp287 = tmp285 + tmp286;
136
               tmp289 = tmp285 - tmp286;
137
          }
138
          tmp288 = tmp284 + tmp287;
139
          tmp310 = K707106781 * (tmp290 + tmp289);
140
          tmp291 = K707106781 * (tmp289 - tmp290);
141
          {
142
               fftw_real tmp296;
143
               fftw_real tmp323;
144
               fftw_real tmp299;
145
               fftw_real tmp324;
146
               ASSERT_ALIGNED_DOUBLE();
147
               {
148
                    fftw_real tmp294;
149
                    fftw_real tmp295;
150
                    fftw_real tmp297;
151
                    fftw_real tmp298;
152
                    ASSERT_ALIGNED_DOUBLE();
153
                    tmp294 = X[15 * iostride];
154
                    tmp295 = X[7 * iostride];
155
                    tmp296 = tmp294 - tmp295;
156
                    tmp323 = tmp294 + tmp295;
157
                    tmp297 = X[3 * iostride];
158
                    tmp298 = X[11 * iostride];
159
                    tmp299 = tmp297 - tmp298;
160
                    tmp324 = tmp297 + tmp298;
161
               }
162
               tmp300 = (K382683432 * tmp296) - (K923879532 * tmp299);
163
               tmp315 = (K923879532 * tmp296) + (K382683432 * tmp299);
164
               tmp325 = tmp323 - tmp324;
165
               tmp331 = tmp323 + tmp324;
166
          }
167
          {
168
               fftw_real tmp329;
169
               fftw_real tmp332;
170
               fftw_real tmp327;
171
               fftw_real tmp328;
172
               ASSERT_ALIGNED_DOUBLE();
173
               X[4 * iostride] = tmp281 - tmp288;
174
               tmp329 = tmp281 + tmp288;
175
               tmp332 = tmp330 + tmp331;
176
               X[8 * iostride] = tmp329 - tmp332;
177
               X[0] = tmp329 + tmp332;
178
               Y[-4 * iostride] = tmp331 - tmp330;
179
               tmp327 = tmp287 - tmp284;
180
               tmp328 = K707106781 * (tmp325 - tmp322);
181
               Y[-2 * iostride] = tmp327 + tmp328;
182
               Y[-6 * iostride] = tmp328 - tmp327;
183
          }
184
          {
185
               fftw_real tmp319;
186
               fftw_real tmp326;
187
               fftw_real tmp313;
188
               fftw_real tmp316;
189
               ASSERT_ALIGNED_DOUBLE();
190
               tmp319 = tmp277 - tmp280;
191
               tmp326 = K707106781 * (tmp322 + tmp325);
192
               X[6 * iostride] = tmp319 - tmp326;
193
               X[2 * iostride] = tmp319 + tmp326;
194
               tmp313 = tmp309 + tmp310;
195
               tmp316 = tmp314 + tmp315;
196
               X[7 * iostride] = tmp313 - tmp316;
197
               X[iostride] = tmp313 + tmp316;
198
          }
199
          tmp317 = tmp292 + tmp291;
200
          tmp318 = tmp315 - tmp314;
201
          Y[-3 * iostride] = tmp317 + tmp318;
202
          Y[-5 * iostride] = tmp318 - tmp317;
203
          {
204
               fftw_real tmp293;
205
               fftw_real tmp308;
206
               fftw_real tmp311;
207
               fftw_real tmp312;
208
               ASSERT_ALIGNED_DOUBLE();
209
               tmp293 = tmp291 - tmp292;
210
               tmp308 = tmp300 - tmp307;
211
               Y[-iostride] = tmp293 + tmp308;
212
               Y[-7 * iostride] = tmp308 - tmp293;
213
               tmp311 = tmp309 - tmp310;
214
               tmp312 = tmp307 + tmp300;
215
               X[5 * iostride] = tmp311 - tmp312;
216
               X[3 * iostride] = tmp311 + tmp312;
217
          }
218
     }
219
     X = X + dist;
220
     Y = Y - dist;
221
     for (i = 2; i < m; i = i + 2, X = X + dist, Y = Y - dist, W = W + 15) {
222
          fftw_real tmp77;
223
          fftw_real tmp161;
224
          fftw_real tmp249;
225
          fftw_real tmp262;
226
          fftw_real tmp88;
227
          fftw_real tmp263;
228
          fftw_real tmp164;
229
          fftw_real tmp246;
230
          fftw_real tmp147;
231
          fftw_real tmp158;
232
          fftw_real tmp231;
233
          fftw_real tmp198;
234
          fftw_real tmp214;
235
          fftw_real tmp232;
236
          fftw_real tmp233;
237
          fftw_real tmp234;
238
          fftw_real tmp193;
239
          fftw_real tmp213;
240
          fftw_real tmp100;
241
          fftw_real tmp222;
242
          fftw_real tmp170;
243
          fftw_real tmp206;
244
          fftw_real tmp111;
245
          fftw_real tmp223;
246
          fftw_real tmp175;
247
          fftw_real tmp207;
248
          fftw_real tmp124;
249
          fftw_real tmp135;
250
          fftw_real tmp226;
251
          fftw_real tmp187;
252
          fftw_real tmp211;
253
          fftw_real tmp227;
254
          fftw_real tmp228;
255
          fftw_real tmp229;
256
          fftw_real tmp182;
257
          fftw_real tmp210;
258
          ASSERT_ALIGNED_DOUBLE();
259
          {
260
               fftw_real tmp71;
261
               fftw_real tmp248;
262
               fftw_real tmp76;
263
               fftw_real tmp247;
264
               ASSERT_ALIGNED_DOUBLE();
265
               tmp71 = X[0];
266
               tmp248 = Y[-15 * iostride];
267
               {
268
                    fftw_real tmp73;
269
                    fftw_real tmp75;
270
                    fftw_real tmp72;
271
                    fftw_real tmp74;
272
                    ASSERT_ALIGNED_DOUBLE();
273
                    tmp73 = X[8 * iostride];
274
                    tmp75 = Y[-7 * iostride];
275
                    tmp72 = c_re(W[7]);
276
                    tmp74 = c_im(W[7]);
277
                    tmp76 = (tmp72 * tmp73) - (tmp74 * tmp75);
278
                    tmp247 = (tmp74 * tmp73) + (tmp72 * tmp75);
279
               }
280
               tmp77 = tmp71 + tmp76;
281
               tmp161 = tmp71 - tmp76;
282
               tmp249 = tmp247 + tmp248;
283
               tmp262 = tmp248 - tmp247;
284
          }
285
          {
286
               fftw_real tmp82;
287
               fftw_real tmp162;
288
               fftw_real tmp87;
289
               fftw_real tmp163;
290
               ASSERT_ALIGNED_DOUBLE();
291
               {
292
                    fftw_real tmp79;
293
                    fftw_real tmp81;
294
                    fftw_real tmp78;
295
                    fftw_real tmp80;
296
                    ASSERT_ALIGNED_DOUBLE();
297
                    tmp79 = X[4 * iostride];
298
                    tmp81 = Y[-11 * iostride];
299
                    tmp78 = c_re(W[3]);
300
                    tmp80 = c_im(W[3]);
301
                    tmp82 = (tmp78 * tmp79) - (tmp80 * tmp81);
302
                    tmp162 = (tmp80 * tmp79) + (tmp78 * tmp81);
303
               }
304
               {
305
                    fftw_real tmp84;
306
                    fftw_real tmp86;
307
                    fftw_real tmp83;
308
                    fftw_real tmp85;
309
                    ASSERT_ALIGNED_DOUBLE();
310
                    tmp84 = X[12 * iostride];
311
                    tmp86 = Y[-3 * iostride];
312
                    tmp83 = c_re(W[11]);
313
                    tmp85 = c_im(W[11]);
314
                    tmp87 = (tmp83 * tmp84) - (tmp85 * tmp86);
315
                    tmp163 = (tmp85 * tmp84) + (tmp83 * tmp86);
316
               }
317
               tmp88 = tmp82 + tmp87;
318
               tmp263 = tmp82 - tmp87;
319
               tmp164 = tmp162 - tmp163;
320
               tmp246 = tmp162 + tmp163;
321
          }
322
          {
323
               fftw_real tmp141;
324
               fftw_real tmp194;
325
               fftw_real tmp157;
326
               fftw_real tmp191;
327
               fftw_real tmp146;
328
               fftw_real tmp195;
329
               fftw_real tmp152;
330
               fftw_real tmp190;
331
               ASSERT_ALIGNED_DOUBLE();
332
               {
333
                    fftw_real tmp138;
334
                    fftw_real tmp140;
335
                    fftw_real tmp137;
336
                    fftw_real tmp139;
337
                    ASSERT_ALIGNED_DOUBLE();
338
                    tmp138 = X[15 * iostride];
339
                    tmp140 = Y[0];
340
                    tmp137 = c_re(W[14]);
341
                    tmp139 = c_im(W[14]);
342
                    tmp141 = (tmp137 * tmp138) - (tmp139 * tmp140);
343
                    tmp194 = (tmp139 * tmp138) + (tmp137 * tmp140);
344
               }
345
               {
346
                    fftw_real tmp154;
347
                    fftw_real tmp156;
348
                    fftw_real tmp153;
349
                    fftw_real tmp155;
350
                    ASSERT_ALIGNED_DOUBLE();
351
                    tmp154 = X[11 * iostride];
352
                    tmp156 = Y[-4 * iostride];
353
                    tmp153 = c_re(W[10]);
354
                    tmp155 = c_im(W[10]);
355
                    tmp157 = (tmp153 * tmp154) - (tmp155 * tmp156);
356
                    tmp191 = (tmp155 * tmp154) + (tmp153 * tmp156);
357
               }
358
               {
359
                    fftw_real tmp143;
360
                    fftw_real tmp145;
361
                    fftw_real tmp142;
362
                    fftw_real tmp144;
363
                    ASSERT_ALIGNED_DOUBLE();
364
                    tmp143 = X[7 * iostride];
365
                    tmp145 = Y[-8 * iostride];
366
                    tmp142 = c_re(W[6]);
367
                    tmp144 = c_im(W[6]);
368
                    tmp146 = (tmp142 * tmp143) - (tmp144 * tmp145);
369
                    tmp195 = (tmp144 * tmp143) + (tmp142 * tmp145);
370
               }
371
               {
372
                    fftw_real tmp149;
373
                    fftw_real tmp151;
374
                    fftw_real tmp148;
375
                    fftw_real tmp150;
376
                    ASSERT_ALIGNED_DOUBLE();
377
                    tmp149 = X[3 * iostride];
378
                    tmp151 = Y[-12 * iostride];
379
                    tmp148 = c_re(W[2]);
380
                    tmp150 = c_im(W[2]);
381
                    tmp152 = (tmp148 * tmp149) - (tmp150 * tmp151);
382
                    tmp190 = (tmp150 * tmp149) + (tmp148 * tmp151);
383
               }
384
               {
385
                    fftw_real tmp196;
386
                    fftw_real tmp197;
387
                    fftw_real tmp189;
388
                    fftw_real tmp192;
389
                    ASSERT_ALIGNED_DOUBLE();
390
                    tmp147 = tmp141 + tmp146;
391
                    tmp158 = tmp152 + tmp157;
392
                    tmp231 = tmp147 - tmp158;
393
                    tmp196 = tmp194 - tmp195;
394
                    tmp197 = tmp152 - tmp157;
395
                    tmp198 = tmp196 + tmp197;
396
                    tmp214 = tmp196 - tmp197;
397
                    tmp232 = tmp194 + tmp195;
398
                    tmp233 = tmp190 + tmp191;
399
                    tmp234 = tmp232 - tmp233;
400
                    tmp189 = tmp141 - tmp146;
401
                    tmp192 = tmp190 - tmp191;
402
                    tmp193 = tmp189 - tmp192;
403
                    tmp213 = tmp189 + tmp192;
404
               }
405
          }
406
          {
407
               fftw_real tmp94;
408
               fftw_real tmp166;
409
               fftw_real tmp99;
410
               fftw_real tmp167;
411
               fftw_real tmp168;
412
               fftw_real tmp169;
413
               ASSERT_ALIGNED_DOUBLE();
414
               {
415
                    fftw_real tmp91;
416
                    fftw_real tmp93;
417
                    fftw_real tmp90;
418
                    fftw_real tmp92;
419
                    ASSERT_ALIGNED_DOUBLE();
420
                    tmp91 = X[2 * iostride];
421
                    tmp93 = Y[-13 * iostride];
422
                    tmp90 = c_re(W[1]);
423
                    tmp92 = c_im(W[1]);
424
                    tmp94 = (tmp90 * tmp91) - (tmp92 * tmp93);
425
                    tmp166 = (tmp92 * tmp91) + (tmp90 * tmp93);
426
               }
427
               {
428
                    fftw_real tmp96;
429
                    fftw_real tmp98;
430
                    fftw_real tmp95;
431
                    fftw_real tmp97;
432
                    ASSERT_ALIGNED_DOUBLE();
433
                    tmp96 = X[10 * iostride];
434
                    tmp98 = Y[-5 * iostride];
435
                    tmp95 = c_re(W[9]);
436
                    tmp97 = c_im(W[9]);
437
                    tmp99 = (tmp95 * tmp96) - (tmp97 * tmp98);
438
                    tmp167 = (tmp97 * tmp96) + (tmp95 * tmp98);
439
               }
440
               tmp100 = tmp94 + tmp99;
441
               tmp222 = tmp166 + tmp167;
442
               tmp168 = tmp166 - tmp167;
443
               tmp169 = tmp94 - tmp99;
444
               tmp170 = tmp168 - tmp169;
445
               tmp206 = tmp169 + tmp168;
446
          }
447
          {
448
               fftw_real tmp105;
449
               fftw_real tmp172;
450
               fftw_real tmp110;
451
               fftw_real tmp173;
452
               fftw_real tmp171;
453
               fftw_real tmp174;
454
               ASSERT_ALIGNED_DOUBLE();
455
               {
456
                    fftw_real tmp102;
457
                    fftw_real tmp104;
458
                    fftw_real tmp101;
459
                    fftw_real tmp103;
460
                    ASSERT_ALIGNED_DOUBLE();
461
                    tmp102 = X[14 * iostride];
462
                    tmp104 = Y[-iostride];
463
                    tmp101 = c_re(W[13]);
464
                    tmp103 = c_im(W[13]);
465
                    tmp105 = (tmp101 * tmp102) - (tmp103 * tmp104);
466
                    tmp172 = (tmp103 * tmp102) + (tmp101 * tmp104);
467
               }
468
               {
469
                    fftw_real tmp107;
470
                    fftw_real tmp109;
471
                    fftw_real tmp106;
472
                    fftw_real tmp108;
473
                    ASSERT_ALIGNED_DOUBLE();
474
                    tmp107 = X[6 * iostride];
475
                    tmp109 = Y[-9 * iostride];
476
                    tmp106 = c_re(W[5]);
477
                    tmp108 = c_im(W[5]);
478
                    tmp110 = (tmp106 * tmp107) - (tmp108 * tmp109);
479
                    tmp173 = (tmp108 * tmp107) + (tmp106 * tmp109);
480
               }
481
               tmp111 = tmp105 + tmp110;
482
               tmp223 = tmp172 + tmp173;
483
               tmp171 = tmp105 - tmp110;
484
               tmp174 = tmp172 - tmp173;
485
               tmp175 = tmp171 + tmp174;
486
               tmp207 = tmp171 - tmp174;
487
          }
488
          {
489
               fftw_real tmp118;
490
               fftw_real tmp178;
491
               fftw_real tmp134;
492
               fftw_real tmp185;
493
               fftw_real tmp123;
494
               fftw_real tmp179;
495
               fftw_real tmp129;
496
               fftw_real tmp184;
497
               ASSERT_ALIGNED_DOUBLE();
498
               {
499
                    fftw_real tmp115;
500
                    fftw_real tmp117;
501
                    fftw_real tmp114;
502
                    fftw_real tmp116;
503
                    ASSERT_ALIGNED_DOUBLE();
504
                    tmp115 = X[iostride];
505
                    tmp117 = Y[-14 * iostride];
506
                    tmp114 = c_re(W[0]);
507
                    tmp116 = c_im(W[0]);
508
                    tmp118 = (tmp114 * tmp115) - (tmp116 * tmp117);
509
                    tmp178 = (tmp116 * tmp115) + (tmp114 * tmp117);
510
               }
511
               {
512
                    fftw_real tmp131;
513
                    fftw_real tmp133;
514
                    fftw_real tmp130;
515
                    fftw_real tmp132;
516
                    ASSERT_ALIGNED_DOUBLE();
517
                    tmp131 = X[13 * iostride];
518
                    tmp133 = Y[-2 * iostride];
519
                    tmp130 = c_re(W[12]);
520
                    tmp132 = c_im(W[12]);
521
                    tmp134 = (tmp130 * tmp131) - (tmp132 * tmp133);
522
                    tmp185 = (tmp132 * tmp131) + (tmp130 * tmp133);
523
               }
524
               {
525
                    fftw_real tmp120;
526
                    fftw_real tmp122;
527
                    fftw_real tmp119;
528
                    fftw_real tmp121;
529
                    ASSERT_ALIGNED_DOUBLE();
530
                    tmp120 = X[9 * iostride];
531
                    tmp122 = Y[-6 * iostride];
532
                    tmp119 = c_re(W[8]);
533
                    tmp121 = c_im(W[8]);
534
                    tmp123 = (tmp119 * tmp120) - (tmp121 * tmp122);
535
                    tmp179 = (tmp121 * tmp120) + (tmp119 * tmp122);
536
               }
537
               {
538
                    fftw_real tmp126;
539
                    fftw_real tmp128;
540
                    fftw_real tmp125;
541
                    fftw_real tmp127;
542
                    ASSERT_ALIGNED_DOUBLE();
543
                    tmp126 = X[5 * iostride];
544
                    tmp128 = Y[-10 * iostride];
545
                    tmp125 = c_re(W[4]);
546
                    tmp127 = c_im(W[4]);
547
                    tmp129 = (tmp125 * tmp126) - (tmp127 * tmp128);
548
                    tmp184 = (tmp127 * tmp126) + (tmp125 * tmp128);
549
               }
550
               {
551
                    fftw_real tmp183;
552
                    fftw_real tmp186;
553
                    fftw_real tmp180;
554
                    fftw_real tmp181;
555
                    ASSERT_ALIGNED_DOUBLE();
556
                    tmp124 = tmp118 + tmp123;
557
                    tmp135 = tmp129 + tmp134;
558
                    tmp226 = tmp124 - tmp135;
559
                    tmp183 = tmp118 - tmp123;
560
                    tmp186 = tmp184 - tmp185;
561
                    tmp187 = tmp183 - tmp186;
562
                    tmp211 = tmp183 + tmp186;
563
                    tmp227 = tmp178 + tmp179;
564
                    tmp228 = tmp184 + tmp185;
565
                    tmp229 = tmp227 - tmp228;
566
                    tmp180 = tmp178 - tmp179;
567
                    tmp181 = tmp129 - tmp134;
568
                    tmp182 = tmp180 + tmp181;
569
                    tmp210 = tmp180 - tmp181;
570
               }
571
          }
572
          {
573
               fftw_real tmp177;
574
               fftw_real tmp201;
575
               fftw_real tmp271;
576
               fftw_real tmp273;
577
               fftw_real tmp200;
578
               fftw_real tmp274;
579
               fftw_real tmp204;
580
               fftw_real tmp272;
581
               ASSERT_ALIGNED_DOUBLE();
582
               {
583
                    fftw_real tmp165;
584
                    fftw_real tmp176;
585
                    fftw_real tmp269;
586
                    fftw_real tmp270;
587
                    ASSERT_ALIGNED_DOUBLE();
588
                    tmp165 = tmp161 - tmp164;
589
                    tmp176 = K707106781 * (tmp170 - tmp175);
590
                    tmp177 = tmp165 + tmp176;
591
                    tmp201 = tmp165 - tmp176;
592
                    tmp269 = K707106781 * (tmp207 - tmp206);
593
                    tmp270 = tmp263 + tmp262;
594
                    tmp271 = tmp269 + tmp270;
595
                    tmp273 = tmp270 - tmp269;
596
               }
597
               {
598
                    fftw_real tmp188;
599
                    fftw_real tmp199;
600
                    fftw_real tmp202;
601
                    fftw_real tmp203;
602
                    ASSERT_ALIGNED_DOUBLE();
603
                    tmp188 = (K923879532 * tmp182) + (K382683432 * tmp187);
604
                    tmp199 = (K382683432 * tmp193) - (K923879532 * tmp198);
605
                    tmp200 = tmp188 + tmp199;
606
                    tmp274 = tmp199 - tmp188;
607
                    tmp202 = (K382683432 * tmp182) - (K923879532 * tmp187);
608
                    tmp203 = (K382683432 * tmp198) + (K923879532 * tmp193);
609
                    tmp204 = tmp202 - tmp203;
610
                    tmp272 = tmp202 + tmp203;
611
               }
612
               Y[-11 * iostride] = tmp177 - tmp200;
613
               X[3 * iostride] = tmp177 + tmp200;
614
               Y[-15 * iostride] = tmp201 - tmp204;
615
               X[7 * iostride] = tmp201 + tmp204;
616
               X[11 * iostride] = -(tmp271 - tmp272);
617
               Y[-3 * iostride] = tmp272 + tmp271;
618
               X[15 * iostride] = -(tmp273 - tmp274);
619
               Y[-7 * iostride] = tmp274 + tmp273;
620
          }
621
          {
622
               fftw_real tmp209;
623
               fftw_real tmp217;
624
               fftw_real tmp265;
625
               fftw_real tmp267;
626
               fftw_real tmp216;
627
               fftw_real tmp268;
628
               fftw_real tmp220;
629
               fftw_real tmp266;
630
               ASSERT_ALIGNED_DOUBLE();
631
               {
632
                    fftw_real tmp205;
633
                    fftw_real tmp208;
634
                    fftw_real tmp261;
635
                    fftw_real tmp264;
636
                    ASSERT_ALIGNED_DOUBLE();
637
                    tmp205 = tmp161 + tmp164;
638
                    tmp208 = K707106781 * (tmp206 + tmp207);
639
                    tmp209 = tmp205 + tmp208;
640
                    tmp217 = tmp205 - tmp208;
641
                    tmp261 = K707106781 * (tmp170 + tmp175);
642
                    tmp264 = tmp262 - tmp263;
643
                    tmp265 = tmp261 + tmp264;
644
                    tmp267 = tmp264 - tmp261;
645
               }
646
               {
647
                    fftw_real tmp212;
648
                    fftw_real tmp215;
649
                    fftw_real tmp218;
650
                    fftw_real tmp219;
651
                    ASSERT_ALIGNED_DOUBLE();
652
                    tmp212 = (K382683432 * tmp210) + (K923879532 * tmp211);
653
                    tmp215 = (K923879532 * tmp213) - (K382683432 * tmp214);
654
                    tmp216 = tmp212 + tmp215;
655
                    tmp268 = tmp215 - tmp212;
656
                    tmp218 = (K923879532 * tmp210) - (K382683432 * tmp211);
657
                    tmp219 = (K923879532 * tmp214) + (K382683432 * tmp213);
658
                    tmp220 = tmp218 - tmp219;
659
                    tmp266 = tmp218 + tmp219;
660
               }
661
               Y[-9 * iostride] = tmp209 - tmp216;
662
               X[iostride] = tmp209 + tmp216;
663
               Y[-13 * iostride] = tmp217 - tmp220;
664
               X[5 * iostride] = tmp217 + tmp220;
665
               X[9 * iostride] = -(tmp265 - tmp266);
666
               Y[-iostride] = tmp266 + tmp265;
667
               X[13 * iostride] = -(tmp267 - tmp268);
668
               Y[-5 * iostride] = tmp268 + tmp267;
669
          }
670
          {
671
               fftw_real tmp225;
672
               fftw_real tmp237;
673
               fftw_real tmp257;
674
               fftw_real tmp259;
675
               fftw_real tmp236;
676
               fftw_real tmp260;
677
               fftw_real tmp240;
678
               fftw_real tmp258;
679
               ASSERT_ALIGNED_DOUBLE();
680
               {
681
                    fftw_real tmp221;
682
                    fftw_real tmp224;
683
                    fftw_real tmp255;
684
                    fftw_real tmp256;
685
                    ASSERT_ALIGNED_DOUBLE();
686
                    tmp221 = tmp77 - tmp88;
687
                    tmp224 = tmp222 - tmp223;
688
                    tmp225 = tmp221 + tmp224;
689
                    tmp237 = tmp221 - tmp224;
690
                    tmp255 = tmp111 - tmp100;
691
                    tmp256 = tmp249 - tmp246;
692
                    tmp257 = tmp255 + tmp256;
693
                    tmp259 = tmp256 - tmp255;
694
               }
695
               {
696
                    fftw_real tmp230;
697
                    fftw_real tmp235;
698
                    fftw_real tmp238;
699
                    fftw_real tmp239;
700
                    ASSERT_ALIGNED_DOUBLE();
701
                    tmp230 = tmp226 + tmp229;
702
                    tmp235 = tmp231 - tmp234;
703
                    tmp236 = K707106781 * (tmp230 + tmp235);
704
                    tmp260 = K707106781 * (tmp235 - tmp230);
705
                    tmp238 = tmp229 - tmp226;
706
                    tmp239 = tmp231 + tmp234;
707
                    tmp240 = K707106781 * (tmp238 - tmp239);
708
                    tmp258 = K707106781 * (tmp238 + tmp239);
709
               }
710
               Y[-10 * iostride] = tmp225 - tmp236;
711
               X[2 * iostride] = tmp225 + tmp236;
712
               Y[-14 * iostride] = tmp237 - tmp240;
713
               X[6 * iostride] = tmp237 + tmp240;
714
               X[10 * iostride] = -(tmp257 - tmp258);
715
               Y[-2 * iostride] = tmp258 + tmp257;
716
               X[14 * iostride] = -(tmp259 - tmp260);
717
               Y[-6 * iostride] = tmp260 + tmp259;
718
          }
719
          {
720
               fftw_real tmp113;
721
               fftw_real tmp241;
722
               fftw_real tmp251;
723
               fftw_real tmp253;
724
               fftw_real tmp160;
725
               fftw_real tmp254;
726
               fftw_real tmp244;
727
               fftw_real tmp252;
728
               ASSERT_ALIGNED_DOUBLE();
729
               {
730
                    fftw_real tmp89;
731
                    fftw_real tmp112;
732
                    fftw_real tmp245;
733
                    fftw_real tmp250;
734
                    ASSERT_ALIGNED_DOUBLE();
735
                    tmp89 = tmp77 + tmp88;
736
                    tmp112 = tmp100 + tmp111;
737
                    tmp113 = tmp89 + tmp112;
738
                    tmp241 = tmp89 - tmp112;
739
                    tmp245 = tmp222 + tmp223;
740
                    tmp250 = tmp246 + tmp249;
741
                    tmp251 = tmp245 + tmp250;
742
                    tmp253 = tmp250 - tmp245;
743
               }
744
               {
745
                    fftw_real tmp136;
746
                    fftw_real tmp159;
747
                    fftw_real tmp242;
748
                    fftw_real tmp243;
749
                    ASSERT_ALIGNED_DOUBLE();
750
                    tmp136 = tmp124 + tmp135;
751
                    tmp159 = tmp147 + tmp158;
752
                    tmp160 = tmp136 + tmp159;
753
                    tmp254 = tmp159 - tmp136;
754
                    tmp242 = tmp227 + tmp228;
755
                    tmp243 = tmp232 + tmp233;
756
                    tmp244 = tmp242 - tmp243;
757
                    tmp252 = tmp242 + tmp243;
758
               }
759
               Y[-8 * iostride] = tmp113 - tmp160;
760
               X[0] = tmp113 + tmp160;
761
               Y[-12 * iostride] = tmp241 - tmp244;
762
               X[4 * iostride] = tmp241 + tmp244;
763
               X[8 * iostride] = -(tmp251 - tmp252);
764
               Y[0] = tmp252 + tmp251;
765
               X[12 * iostride] = -(tmp253 - tmp254);
766
               Y[-4 * iostride] = tmp254 + tmp253;
767
          }
768
     }
769
     if (i == m) {
770
          fftw_real tmp5;
771
          fftw_real tmp41;
772
          fftw_real tmp61;
773
          fftw_real tmp67;
774
          fftw_real tmp30;
775
          fftw_real tmp49;
776
          fftw_real tmp34;
777
          fftw_real tmp50;
778
          fftw_real tmp12;
779
          fftw_real tmp66;
780
          fftw_real tmp44;
781
          fftw_real tmp58;
782
          fftw_real tmp19;
783
          fftw_real tmp46;
784
          fftw_real tmp23;
785
          fftw_real tmp47;
786
          ASSERT_ALIGNED_DOUBLE();
787
          {
788
               fftw_real tmp1;
789
               fftw_real tmp60;
790
               fftw_real tmp4;
791
               fftw_real tmp59;
792
               fftw_real tmp2;
793
               fftw_real tmp3;
794
               ASSERT_ALIGNED_DOUBLE();
795
               tmp1 = X[0];
796
               tmp60 = X[8 * iostride];
797
               tmp2 = X[4 * iostride];
798
               tmp3 = X[12 * iostride];
799
               tmp4 = K707106781 * (tmp2 - tmp3);
800
               tmp59 = K707106781 * (tmp2 + tmp3);
801
               tmp5 = tmp1 + tmp4;
802
               tmp41 = tmp1 - tmp4;
803
               tmp61 = tmp59 + tmp60;
804
               tmp67 = tmp60 - tmp59;
805
          }
806
          {
807
               fftw_real tmp29;
808
               fftw_real tmp33;
809
               fftw_real tmp27;
810
               fftw_real tmp31;
811
               ASSERT_ALIGNED_DOUBLE();
812
               {
813
                    fftw_real tmp28;
814
                    fftw_real tmp32;
815
                    fftw_real tmp25;
816
                    fftw_real tmp26;
817
                    ASSERT_ALIGNED_DOUBLE();
818
                    tmp28 = X[15 * iostride];
819
                    tmp29 = K2_000000000 * tmp28;
820
                    tmp32 = X[7 * iostride];
821
                    tmp33 = K2_000000000 * tmp32;
822
                    tmp25 = X[3 * iostride];
823
                    tmp26 = X[11 * iostride];
824
                    tmp27 = K1_414213562 * (tmp25 - tmp26);
825
                    tmp31 = K1_414213562 * (tmp25 + tmp26);
826
               }
827
               tmp30 = tmp27 - tmp29;
828
               tmp49 = tmp27 + tmp29;
829
               tmp34 = tmp31 + tmp33;
830
               tmp50 = tmp33 - tmp31;
831
          }
832
          {
833
               fftw_real tmp8;
834
               fftw_real tmp42;
835
               fftw_real tmp11;
836
               fftw_real tmp43;
837
               ASSERT_ALIGNED_DOUBLE();
838
               {
839
                    fftw_real tmp6;
840
                    fftw_real tmp7;
841
                    fftw_real tmp9;
842
                    fftw_real tmp10;
843
                    ASSERT_ALIGNED_DOUBLE();
844
                    tmp6 = X[2 * iostride];
845
                    tmp7 = X[10 * iostride];
846
                    tmp8 = (K923879532 * tmp6) - (K382683432 * tmp7);
847
                    tmp42 = (K382683432 * tmp6) + (K923879532 * tmp7);
848
                    tmp9 = X[6 * iostride];
849
                    tmp10 = X[14 * iostride];
850
                    tmp11 = (K382683432 * tmp9) - (K923879532 * tmp10);
851
                    tmp43 = (K923879532 * tmp9) + (K382683432 * tmp10);
852
               }
853
               tmp12 = tmp8 + tmp11;
854
               tmp66 = tmp11 - tmp8;
855
               tmp44 = tmp42 - tmp43;
856
               tmp58 = tmp42 + tmp43;
857
          }
858
          {
859
               fftw_real tmp15;
860
               fftw_real tmp22;
861
               fftw_real tmp18;
862
               fftw_real tmp20;
863
               ASSERT_ALIGNED_DOUBLE();
864
               {
865
                    fftw_real tmp14;
866
                    fftw_real tmp21;
867
                    fftw_real tmp16;
868
                    fftw_real tmp17;
869
                    ASSERT_ALIGNED_DOUBLE();
870
                    tmp14 = X[iostride];
871
                    tmp15 = K2_000000000 * tmp14;
872
                    tmp21 = X[9 * iostride];
873
                    tmp22 = K2_000000000 * tmp21;
874
                    tmp16 = X[5 * iostride];
875
                    tmp17 = X[13 * iostride];
876
                    tmp18 = K1_414213562 * (tmp16 - tmp17);
877
                    tmp20 = K1_414213562 * (tmp16 + tmp17);
878
               }
879
               tmp19 = tmp15 + tmp18;
880
               tmp46 = tmp15 - tmp18;
881
               tmp23 = tmp20 + tmp22;
882
               tmp47 = tmp22 - tmp20;
883
          }
884
          {
885
               fftw_real tmp13;
886
               fftw_real tmp62;
887
               fftw_real tmp36;
888
               fftw_real tmp57;
889
               fftw_real tmp24;
890
               fftw_real tmp35;
891
               ASSERT_ALIGNED_DOUBLE();
892
               tmp13 = tmp5 - tmp12;
893
               tmp62 = tmp58 + tmp61;
894
               tmp24 = (K097545161 * tmp19) + (K490392640 * tmp23);
895
               tmp35 = (K097545161 * tmp30) - (K490392640 * tmp34);
896
               tmp36 = tmp24 + tmp35;
897
               tmp57 = tmp35 - tmp24;
898
               X[4 * iostride] = tmp13 - tmp36;
899
               X[3 * iostride] = tmp13 + tmp36;
900
               Y[0] = tmp57 - tmp62;
901
               Y[-7 * iostride] = tmp57 + tmp62;
902
          }
903
          {
904
               fftw_real tmp37;
905
               fftw_real tmp64;
906
               fftw_real tmp40;
907
               fftw_real tmp63;
908
               fftw_real tmp38;
909
               fftw_real tmp39;
910
               ASSERT_ALIGNED_DOUBLE();
911
               tmp37 = tmp5 + tmp12;
912
               tmp64 = tmp61 - tmp58;
913
               tmp38 = (K490392640 * tmp19) - (K097545161 * tmp23);
914
               tmp39 = (K490392640 * tmp30) + (K097545161 * tmp34);
915
               tmp40 = tmp38 + tmp39;
916
               tmp63 = tmp39 - tmp38;
917
               X[7 * iostride] = tmp37 - tmp40;
918
               X[0] = tmp37 + tmp40;
919
               Y[-4 * iostride] = tmp63 - tmp64;
920
               Y[-3 * iostride] = tmp63 + tmp64;
921
          }
922
          {
923
               fftw_real tmp45;
924
               fftw_real tmp68;
925
               fftw_real tmp52;
926
               fftw_real tmp65;
927
               fftw_real tmp48;
928
               fftw_real tmp51;
929
               ASSERT_ALIGNED_DOUBLE();
930
               tmp45 = tmp41 + tmp44;
931
               tmp68 = tmp66 - tmp67;
932
               tmp48 = (K415734806 * tmp46) + (K277785116 * tmp47);
933
               tmp51 = (K415734806 * tmp49) + (K277785116 * tmp50);
934
               tmp52 = tmp48 - tmp51;
935
               tmp65 = tmp48 + tmp51;
936
               X[6 * iostride] = tmp45 - tmp52;
937
               X[iostride] = tmp45 + tmp52;
938
               Y[-5 * iostride] = -(tmp65 + tmp68);
939
               Y[-2 * iostride] = tmp68 - tmp65;
940
          }
941
          {
942
               fftw_real tmp53;
943
               fftw_real tmp70;
944
               fftw_real tmp56;
945
               fftw_real tmp69;
946
               fftw_real tmp54;
947
               fftw_real tmp55;
948
               ASSERT_ALIGNED_DOUBLE();
949
               tmp53 = tmp41 - tmp44;
950
               tmp70 = tmp66 + tmp67;
951
               tmp54 = (K415734806 * tmp50) - (K277785116 * tmp49);
952
               tmp55 = (K415734806 * tmp47) - (K277785116 * tmp46);
953
               tmp56 = tmp54 - tmp55;
954
               tmp69 = tmp55 + tmp54;
955
               X[5 * iostride] = tmp53 - tmp56;
956
               X[2 * iostride] = tmp53 + tmp56;
957
               Y[-6 * iostride] = tmp69 - tmp70;
958
               Y[-iostride] = tmp69 + tmp70;
959
          }
960
     }
961
}
962
 
963
static const int twiddle_order[] =
964
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15};
965
fftw_codelet_desc fftw_hc2hc_forward_16_desc =
966
{
967
     "fftw_hc2hc_forward_16",
968
     (void (*)()) fftw_hc2hc_forward_16,
969
     16,
970
     FFTW_FORWARD,
971
     FFTW_HC2HC,
972
     355,
973
     15,
974
     twiddle_order,
975
};