/*************************************************************************** TFilmTriVortexFieldCalc.cpp Author: Bastian M. Wojek ***************************************************************************/ /*************************************************************************** * Copyright (C) 2010 by Bastian M. Wojek * * based upon: * * Ernst Helmut Brandt, Phys. Rev. B 71 014521 (2005) * * * * This program is free software; you can redistribute it and/or modify * * it under the terms of the GNU General Public License as published by * * the Free Software Foundation; either version 2 of the License, or * * (at your option) any later version. * * * * This program is distributed in the hope that it will be useful, * * but WITHOUT ANY WARRANTY; without even the implied warranty of * * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * * GNU General Public License for more details. * * * * You should have received a copy of the GNU General Public License * * along with this program; if not, write to the * * Free Software Foundation, Inc., * * 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA. * ***************************************************************************/ #ifdef HAVE_CONFIG_H #include "config.h" #endif #include "TFilmTriVortexFieldCalc.h" #include #include #ifdef HAVE_GOMP #include #endif #include #include "TMath.h" #define PI 3.141592653589793238462643383279502884197169399375105820974944592307816406286208998628034825342117067f #define TWOPI (2.0f*3.141592653589793238462643383279502884197169399375105820974944592307816406286208998628034825342117067f) const float fluxQuantum(2.067833667e7f); // in this case this is Gauss times square nm const float sqrt3(sqrt(3.0f)); const float pi_4sqrt3(0.25f*PI/sqrt(3.0f)); TFilmVortexFieldCalc::~TFilmVortexFieldCalc() { // if a wisdom file is used export the wisdom so it has not to be checked for the FFT-plan next time if (fUseWisdom) { FILE *wordsOfWisdomW; wordsOfWisdomW = fopen(fWisdom.c_str(), "w"); if (wordsOfWisdomW == NULL) { std::cout << "TFilmVortexFieldCalc::~TFilmVortexFieldCalc(): Could not open file ... No wisdom is exported..." << std::endl; } else { fftwf_export_wisdom_to_file(wordsOfWisdomW); fclose(wordsOfWisdomW); } } // clean up fftwf_destroy_plan(fFFTplan); delete[] fFFTin; fFFTin = nullptr; for(unsigned int i(0); i<3; ++i){ delete[] fBout[i]; fBout[i] = 0; } fBout.clear(); fParam.clear(); //fftwf_cleanup(); //fftwf_cleanup_threads(); } float TFilmVortexFieldCalc::GetBmin() const { if (fGridExists) { float min(fBout[2][0]), curfieldSq(0.0); unsigned int curindex(0); for (unsigned int k(0); k < fStepsZ; ++k) { for (unsigned int i(0); i < fSteps/2; ++i) { for (unsigned int j(0); j < fSteps/2; ++j) { // check only the first quadrant of B(x,y) curindex = k + fStepsZ*(j + fSteps*i); curfieldSq = fBout[0][curindex]*fBout[0][curindex] \ + fBout[1][curindex]*fBout[1][curindex] \ + fBout[2][curindex]*fBout[2][curindex]; if (curfieldSq < min) { min = curfieldSq; } } } } return sqrt(min); } else { CalculateGrid(); return GetBmin(); } } float TFilmVortexFieldCalc::GetBmax() const { if (fGridExists) return fBout[2][0]; else { CalculateGrid(); return GetBmax(); } } TFilmTriVortexNGLFieldCalc::TFilmTriVortexNGLFieldCalc(const std::string& wisdom, const unsigned int steps, const unsigned int stepsZ) : fLatticeConstant(0.0), fKappa(0.0), fSumOmegaSq(0.0), fSumSum(0.0), fFind3dSolution(false) { // std::cout << "TFilmTriVortexNGLFieldCalc::TFilmTriVortexNGLFieldCalc... "; fWisdom = wisdom; switch (stepsZ % 2) { case 0: fStepsZ = stepsZ; break; case 1: fStepsZ = stepsZ + 1; break; default: break; } switch (steps % 4) { case 0: fSteps = steps; break; case 1: fSteps = steps + 3; break; case 2: fSteps = steps + 2; break; case 3: fSteps = steps + 1; break; default: break; } fParam.resize(3); fGridExists = false; #if !defined(_WIN32GCC) && defined(HAVE_LIBFFTW3F_THREADS) && defined(HAVE_GOMP) int init_threads(fftwf_init_threads()); if (init_threads) { fftwf_plan_with_nthreads(omp_get_num_procs()); } #endif const unsigned int stepsSqStZ(fSteps*fSteps*fStepsZ); float* temp; for (unsigned int i(0); i < 3; ++i) { temp = new float[stepsSqStZ]; // Bx, By, Bz fBout.push_back(temp); temp = new float[stepsSqStZ]; // (grad omega)_(x,y,z) fOmegaDiffMatrix.push_back(temp); } temp = nullptr; fOmegaMatrix = new float[stepsSqStZ]; // |psi|^2 fFFTin = new fftwf_complex[stepsSqStZ]; // aK matrix fBkMatrix = new fftwf_complex[stepsSqStZ]; // bK matrix fRealSpaceMatrix = new fftwf_complex[stepsSqStZ]; // fftw output matrix fPkMatrix = new fftwf_complex[stepsSqStZ]; // PK matrix fQMatrix = new fftwf_complex[stepsSqStZ]; fQMatrixA = new fftwf_complex[fSteps*fSteps]; fSumAkFFTin = new fftwf_complex[fStepsZ]; fSumAk = new fftwf_complex[fStepsZ]; fBkS = new fftwf_complex[fSteps*fSteps]; fGstorage = new float[fStepsZ]; fCheckAkConvergence = new float[fStepsZ*fSteps]; fCheckBkConvergence = new float[fStepsZ*fSteps]; // Load wisdom from file if it exists and should be used fUseWisdom = true; int wisdomLoaded(0); FILE *wordsOfWisdomR; wordsOfWisdomR = fopen(fWisdom.c_str(), "r"); if (wordsOfWisdomR == nullptr) { fUseWisdom = false; } else { wisdomLoaded = fftwf_import_wisdom_from_file(wordsOfWisdomR); fclose(wordsOfWisdomR); } if (!wisdomLoaded) { fUseWisdom = false; } // create the FFT plans if (fUseWisdom) { // std::cout << "use wisdom ... "; // use the first plan from the base class here - it will be destroyed by the base class destructor fFFTplan = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fFFTin, fRealSpaceMatrix, FFTW_BACKWARD, FFTW_EXHAUSTIVE); fFFTplanBkToBandQ = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fBkMatrix, fBkMatrix, FFTW_BACKWARD, FFTW_EXHAUSTIVE); fFFTplanOmegaToAk = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fRealSpaceMatrix, fFFTin, FFTW_FORWARD, FFTW_EXHAUSTIVE); fFFTplanForSumAk = fftwf_plan_dft_1d(fStepsZ, fSumAkFFTin, fSumAk, FFTW_FORWARD, FFTW_EXHAUSTIVE); fFFTplanForPk1 = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fPkMatrix, fPkMatrix, FFTW_FORWARD, FFTW_EXHAUSTIVE); fFFTplanForPk2 = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fQMatrix, fQMatrix, FFTW_BACKWARD, FFTW_EXHAUSTIVE); fFFTplanForBatSurf = fftwf_plan_dft_2d(fSteps, fSteps, fBkS, fBkS, FFTW_FORWARD, FFTW_EXHAUSTIVE); } else { // std::cout << "do not use wisdom ... "; // use the first plan from the base class here - it will be destroyed by the base class destructor fFFTplan = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fFFTin, fRealSpaceMatrix, FFTW_BACKWARD, FFTW_ESTIMATE); fFFTplanBkToBandQ = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fBkMatrix, fBkMatrix, FFTW_BACKWARD, FFTW_ESTIMATE); fFFTplanOmegaToAk = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fRealSpaceMatrix, fFFTin, FFTW_FORWARD, FFTW_ESTIMATE); fFFTplanForSumAk = fftwf_plan_dft_1d(fStepsZ, fSumAkFFTin, fSumAk, FFTW_FORWARD, FFTW_ESTIMATE); fFFTplanForPk1 = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fPkMatrix, fPkMatrix, FFTW_FORWARD, FFTW_ESTIMATE); fFFTplanForPk2 = fftwf_plan_dft_3d(fSteps, fSteps, fStepsZ, fQMatrix, fQMatrix, FFTW_BACKWARD, FFTW_ESTIMATE); fFFTplanForBatSurf = fftwf_plan_dft_2d(fSteps, fSteps, fBkS, fBkS, FFTW_FORWARD, FFTW_ESTIMATE); } // std::cout << "done" << endl; } TFilmTriVortexNGLFieldCalc::~TFilmTriVortexNGLFieldCalc() { // clean up fftwf_destroy_plan(fFFTplanBkToBandQ); fftwf_destroy_plan(fFFTplanOmegaToAk); fftwf_destroy_plan(fFFTplanForSumAk); fftwf_destroy_plan(fFFTplanForPk1); fftwf_destroy_plan(fFFTplanForPk2); fftwf_destroy_plan(fFFTplanForBatSurf); for (unsigned int i(0); i < 3; ++i) { delete[] fOmegaDiffMatrix[i]; fOmegaDiffMatrix[i] = 0; } fOmegaDiffMatrix.clear(); delete[] fOmegaMatrix; fOmegaMatrix = nullptr; delete[] fBkMatrix; fBkMatrix = nullptr; delete[] fRealSpaceMatrix; fRealSpaceMatrix = nullptr; delete[] fPkMatrix; fPkMatrix = nullptr; delete[] fQMatrix; fQMatrix = nullptr; delete[] fQMatrixA; fQMatrixA = nullptr; delete[] fSumAkFFTin; fSumAkFFTin = nullptr; delete[] fSumAk; fSumAk = nullptr; delete[] fBkS; fBkS = nullptr; delete[] fGstorage; fGstorage = nullptr; delete[] fCheckAkConvergence; fCheckAkConvergence = nullptr; delete[] fCheckBkConvergence; fCheckBkConvergence = nullptr; } void TFilmTriVortexNGLFieldCalc::CalculateGatVortexCore() const { const int NFFT(fSteps); const int NFFT_2(fSteps/2); const int NFFTsq(fSteps*fSteps); const int NFFTsqStZ(NFFTsq*fStepsZ); const int NFFTz(fStepsZ); const int NFFTz_2(fStepsZ/2); float *denom = new float[NFFTz]; int i, j, k, l, index; // First save a copy of the real aK-matrix in the imaginary part of the bK-matrix #ifdef HAVE_GOMP int chunk = NFFTsqStZ/omp_get_num_procs(); if (chunk < 10) chunk = 10; #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fBkMatrix[l][1] = fFFTin[l][0]; } // sum_K aK Kx^2 cos(Kx*x + Ky*y) cos(Kz*z) // First multiply the aK with Kx^2, then call FFTW float coeffKx(4.0/3.0*pow(PI/fLatticeConstant, 2.0f)); // k = 0 #ifdef HAVE_GOMP #pragma omp parallel default(shared) private(i,j) { #pragma omp sections { // even rows #pragma omp section #endif for (i = 0; i < NFFT; i += 2) { // j = 0 fFFTin[fStepsZ*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKx*static_cast(j*j); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKx*static_cast((j - NFFT)*(j - NFFT)); } } // odd rows #ifdef HAVE_GOMP #pragma omp section #endif for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast((j + 1)*(j + 1)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast((j + 1 - NFFT)*(j + 1 - NFFT)); } } #ifdef HAVE_GOMP } // end omp sections #endif // k != 0 if (fFind3dSolution) { for (k = 1; k < NFFTz; ++k) { #ifdef HAVE_GOMP #pragma omp sections { // even rows #pragma omp section #endif for (i = 0; i < NFFT; i += 2) { // j = 0 fFFTin[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast(j*j); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast((j - NFFT)*(j - NFFT)); } } // odd rows #ifdef HAVE_GOMP #pragma omp section #endif for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast((j + 1)*(j + 1)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast((j + 1 - NFFT)*(j + 1 - NFFT)); } } #ifdef HAVE_GOMP } #endif } } // else do nothing since the other aK are already zero since the former aK manipulation #ifdef HAVE_GOMP } // end omp parallel #endif fftwf_execute(fFFTplan); // Copy the results to the gradient matrix and restore the original aK-matrix for (k = 0; k < NFFTz; ++k) { denom[k] = fRealSpaceMatrix[k][0]; fGstorage[k] = fRealSpaceMatrix[k][0]*fRealSpaceMatrix[k][0]; } #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fFFTin[l][0] = fBkMatrix[l][1]; } // sum_K aK Kx Ky cos(Kx*x + Ky*y) cos(Kz*z) // First multiply the aK with Kx*Ky, then call FFTW const float coeffKxKy = (4.0f/sqrt3*pow(PI/fLatticeConstant, 2.0f)); // k = 0 // even rows for (i = 0; i < NFFT_2; i += 2) { // j = 0 fFFTin[fStepsZ*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast(j*i); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast((j - NFFT)*i); } } for (i = NFFT_2; i < NFFT; i += 2) { // j = 0 fFFTin[fStepsZ*NFFT*i][0] = 0.0; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast(j*(i - NFFT)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast((j - NFFT)*(i - NFFT)); } } // odd rows for (i = 1; i < NFFT_2; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1)*i); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1 - NFFT)*i); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1)*(i - NFFT)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1 - NFFT)*(i - NFFT)); } } // k != 0 if (fFind3dSolution) { for (k = 1; k < NFFTz; ++k) { // even rows for (i = 0; i < NFFT_2; i += 2) { // j = 0 fFFTin[k + fStepsZ*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast(j*i); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast((j - NFFT)*i); } } for (i = NFFT_2; i < NFFT; i += 2) { // j = 0 fFFTin[k + fStepsZ*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast(j*(i - NFFT)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKy*static_cast((j - NFFT)*(i - NFFT)); } } // odd rows for (i = 1; i < NFFT_2; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1)*i); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1 - NFFT)*i); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1)*(i - NFFT)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKy*static_cast((j + 1 - NFFT)*(i - NFFT)); } } } } // else do nothing since the other aK are already zero since the former aK manipulation fftwf_execute(fFFTplan); // Copy the results to the gradient matrix and restore the original aK-matrix for (k = 0; k < NFFTz; ++k) { fGstorage[k] += fRealSpaceMatrix[k][0]*fRealSpaceMatrix[k][0]; } #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fFFTin[l][0] = fBkMatrix[l][1]; } // sum_K aK Kx Kz sin(Kx*x + Ky*y) sin(Kz*z) // First multiply the aK with Kx*Kz, then call FFTW const float coeffKxKz(TWOPI*PI/(sqrt3*fLatticeConstant*fThickness)); // k = 0 // even rows for (i = 0; i < NFFT_2; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; } } // odd rows for (i = 1; i < NFFT_2; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; } } // k != 0 if (fFind3dSolution) { for (k = 1; k < NFFTz_2; ++k) { // even rows for (i = 0; i < NFFT; i += 2) { // j = 0 fFFTin[k + fStepsZ*NFFT*i][0] = 0.0; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKz*static_cast(j*k); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKz*static_cast((j - NFFT)*k); } } // odd rows for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKz*static_cast((j + 1)*k); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKz*static_cast((j + 1 - NFFT)*k); } } } for (k = NFFTz_2; k < NFFTz; ++k) { // even rows for (i = 0; i < NFFT; i += 2) { // j = 0 fFFTin[k + fStepsZ*NFFT*i][0] = 0.0; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKz*static_cast(j*(k - NFFTz)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeffKxKz*static_cast((j - NFFT)*(k - NFFTz)); } } // odd rows for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKz*static_cast((j + 1)*(k - NFFTz)); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKxKz*static_cast((j + 1 - NFFT)*(k - NFFTz)); } } } } // else do nothing since the other aK are already zero since the former aK manipulation fftwf_execute(fFFTplan); // Copy the results to the gradient matrix and restore the original aK-matrix for (k = 0; k < NFFTz; ++k) { fGstorage[k] += fRealSpaceMatrix[k][1]*fRealSpaceMatrix[k][1]; } #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fFFTin[l][0] = fBkMatrix[l][1]; } // Final evaluation for (k = 0; k < NFFTz; ++k) { fGstorage[k] /= 2.0*denom[k]*fKappa*fKappa; } delete[] denom; denom = 0; return; } void TFilmTriVortexNGLFieldCalc::CalculateGradient() const { // Calculate the gradient of omega stored in a vector = (dw/dx, dw/dy, dw/dz) const int NFFT(fSteps); const int NFFT_2(fSteps/2); const int NFFTsq(fSteps*fSteps); const int NFFTsqStZ(NFFTsq*fStepsZ); const int NFFTsqStZ_2(NFFTsqStZ/2); const int NFFTz(fStepsZ); const int NFFTz_2(fStepsZ/2); int i, j, k, l, index; #ifdef HAVE_GOMP int chunk = NFFTsqStZ/omp_get_num_procs(); if (chunk < 10) chunk = 10; #endif // Take the derivative of the Fourier sum of omega // This is going to be a bit lengthy... // First save a copy of the real aK-matrix in the imaginary part of the bK-matrix #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fBkMatrix[l][1] = fFFTin[l][0]; } // dw/dx = sum_K aK Kx sin(Kx*x + Ky*y) cos(Kz*z) // First multiply the aK with Kx, then call FFTW const float coeffKx(TWOPI/(sqrt3*fLatticeConstant)); // k = 0 // even rows for (i = 0; i < NFFT; i += 2) { // j = 0 fFFTin[fStepsZ*NFFT*i][0] = 0.0; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKx*static_cast(j); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeffKx*static_cast(j - NFFT); } } // odd rows for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j + 1); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j + 1 - NFFT); } } // k != 0 if (fFind3dSolution) { for (k = 1; k < NFFTz; ++k) { // even rows for (i = 0; i < NFFT; i += 2) { // j = 0 fFFTin[k + NFFTz*NFFT*i][0] = 0.0; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast(j); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast(j - NFFT); } } // odd rows for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT_2; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j + 1); } for (j = NFFT_2; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j + 1 - NFFT); } } } } // else do nothing since the other aK are already zero since the former aK manipulation fftwf_execute(fFFTplan); // Copy the results to the gradient matrix and restore the original aK-matrix #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fOmegaDiffMatrix[0][l] = fRealSpaceMatrix[l][1]; fFFTin[l][0] = fBkMatrix[l][1]; } // dw/dy = sum_K aK Ky sin(Kx*x + Ky*y) cos(Kz*z) // First multiply the aK with Ky, then call FFTW const float coeffKy(TWOPI/fLatticeConstant); float ky; // k = 0 // even rows // i = 0 for (j = 0; j < NFFT; j += 2) { fFFTin[NFFTz*j][0] = 0.0; } // i != 0 for (i = 2; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); for (j = 0; j < NFFT; j += 2) { fFFTin[NFFTz*(j + NFFT*i)][0] *= ky; } } for (i = NFFT_2; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); for (j = 0; j < NFFT; j += 2) { fFFTin[NFFTz*(j + NFFT*i)][0] *= ky; } } // odd rows for (i = 1; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); for (j = 0; j < NFFT; j += 2) { fFFTin[NFFTz*(j + 1 + NFFT*i)][0] *= ky; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); for (j = 0; j < NFFT; j += 2) { fFFTin[NFFTz*(j + 1 + NFFT*i)][0] *= ky; } } // k != 0 if (fFind3dSolution) { for (k = 1; k < NFFTz; ++k) { // even rows // i = 0 for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*j][0] = 0.0; } // i != 0 for (i = 2; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= ky; } } for (i = NFFT_2; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= ky; } } // odd rows for (i = 1; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= ky; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= ky; } } } } // else do nothing since the other aK are already zero since the former aK manipulation fftwf_execute(fFFTplan); // Copy the results to the gradient matrix and restore the original aK-matrix #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fOmegaDiffMatrix[1][l] = fRealSpaceMatrix[l][1]; fFFTin[l][0] = fBkMatrix[l][1]; } // dw/dz = {sum_K aK Kz cos(Kx*x + Ky*y) sin(Kz*z)} - {sum_K aK Kz sin(Kz*z)} // First multiply the aK with Kz, then do the 1D and 3D FFTs const float coeffKz(TWOPI/fThickness); if (fFind3dSolution) { float kz; for (k = 0; k < NFFTz_2; ++k) { kz = coeffKz*static_cast(k); // even rows for (i = 0; i < NFFT; i += 2) { for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= kz; } } // odd rows for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= kz; } } } for (k = NFFTz_2; k < NFFTz; ++k) { kz = coeffKz*static_cast(k - NFFTz); // even rows for (i = 0; i < NFFT; i += 2) { for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + NFFT*i)][0] *= kz; } } // odd rows for (i = 1; i < NFFT; i += 2) { for (j = 0; j < NFFT; j += 2) { fFFTin[k + NFFTz*(j + 1 + NFFT*i)][0] *= kz; } } } // 1D transform - first sum up the coefficients in the other two dimensions and then call FFTW for (k = 0; k < NFFTz; ++k) { fSumAkFFTin[k][0] = 0.0; for (index = 0; index < NFFTsq; ++index) { fSumAkFFTin[k][0] += fFFTin[k + NFFTz*index][0]; } fSumAkFFTin[k][1] = 0.0; } fftwf_execute(fFFTplanForSumAk); // 3D transform fftwf_execute(fFFTplan); #ifdef HAVE_GOMP chunk = NFFTsq/omp_get_num_procs(); if (chunk < 10) chunk = 10; #endif // Copy the results to the gradient matrix - with the 1D-FORWARD-transform we have to _add_ fSumAk for (k = 0; k < NFFTz; ++k) { #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(index) schedule(dynamic,chunk) #endif for (index = 0; index < NFFTsq; ++index) { fOmegaDiffMatrix[2][k + NFFTz*index] = fRealSpaceMatrix[k + NFFTz*index][1] + fSumAk[k][1]; } } // Restore the original aK-matrix #ifdef HAVE_GOMP chunk = NFFTsqStZ/omp_get_num_procs(); if (chunk < 10) chunk = 10; #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fFFTin[l][0] = fBkMatrix[l][1]; fBkMatrix[l][1] = 0.0; } } else { // For the 2D solution, dw/dz = 0 #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(l) schedule(dynamic,chunk) #endif for (l = 0; l < NFFTsqStZ; ++l) { fOmegaDiffMatrix[2][l] = 0.0; fBkMatrix[l][1] = 0.0; } } /* If the numerics is fine, this part is not needed */ // Ensure that omega and the gradient at the vortex-core positions are zero for (k = 0; k < NFFTz; ++k) { fOmegaMatrix[k] = 0.0; fOmegaMatrix[k + NFFTz*(NFFT+1)*NFFT_2] = 0.0; fOmegaDiffMatrix[0][k] = 0.0; fOmegaDiffMatrix[0][k + NFFTz*(NFFT+1)*NFFT_2] = 0.0; fOmegaDiffMatrix[1][k] = 0.0; fOmegaDiffMatrix[1][k + NFFTz*(NFFT+1)*NFFT_2] = 0.0; fOmegaDiffMatrix[2][k] = 0.0; fOmegaDiffMatrix[2][k + NFFTz*(NFFT+1)*NFFT_2] = 0.0; }/* for (i = 0; i < NFFT; ++i) { // j = 0 fOmegaDiffMatrix[0][k + NFFTz*NFFT*i] = 0.0; // j = NFFT_2 fOmegaDiffMatrix[0][k + NFFTz*(NFFT_2 + NFFT*i)] = 0.0; } for (j = 0; j < NFFT; ++j) { // i = 0 fOmegaDiffMatrix[1][k + NFFTz*j] = 0.0; // i = NFFT_2 fOmegaDiffMatrix[1][k + NFFTz*(j + NFFT*NFFT_2)] = 0.0; } fOmegaDiffMatrix[2][k] = 0.0; fOmegaDiffMatrix[2][k + NFFTz*(NFFT+1)*NFFT_2] = 0.0; } for (index = 0; index < NFFTsq; ++index) { // k = 0 fOmegaDiffMatrix[2][index] = 0.0; // k = NFFTz_2 fOmegaDiffMatrix[2][NFFTz_2 + index] = 0.0; } */ return; } void TFilmTriVortexNGLFieldCalc::FillAbrikosovCoefficients(const float reducedField) const { const int NFFT(fSteps), NFFTsq(fSteps*fSteps), NFFT_2(NFFT/2), NFFTz_2(fStepsZ/2), NFFTz(fStepsZ); float coeff(1.0-reducedField); float Gsq, sign, ii; int i,j,k,index; // k = 0; for (i = 0; i < NFFT_2; i += 2) { if (!(i % 4)) { sign = 1.0; } else { sign = -1.0; } ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { sign = -sign; Gsq = static_cast(j*j) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = sign*coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { sign = -sign; Gsq = static_cast((j-NFFT)*(j-NFFT)) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = sign*coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { if (!(i % 4)) { sign = 1.0; } else { sign = -1.0; } ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { sign = -sign; Gsq = static_cast(j*j) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = sign*coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { sign = -sign; Gsq = static_cast((j-NFFT)*(j-NFFT)) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = sign*coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } // intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { Gsq = static_cast((j + 1)*(j + 1)) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { Gsq = static_cast((j+1)*(j+1)) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii; fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = coeff*exp(-pi_4sqrt3*Gsq); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } fFFTin[0][0] = 0.0; #ifdef HAVE_GOMP int chunk = NFFTsq/omp_get_num_procs(); if (chunk < 10) chunk = 10; #endif for (k = 1; k < NFFTz; ++k) { #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(index) schedule(dynamic,chunk) #endif for (index = 0; index < NFFTsq; ++index) { fFFTin[k + NFFTz*index][0] = 0.0; fFFTin[k + NFFTz*index][1] = 0.0; } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsA() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2), NFFTsqStZ(fSteps*fSteps*fStepsZ), NFFTsq(fSteps*fSteps); // Divide EHB's coefficient no2 by two since we are considering "the full 3D reciprocal lattice", not only the half space! // Additionally treat all K the same (no difference between Kperp and K with Kz != 0) const float symCorr(1.0f); const float coeff1(4.0f/3.0f*pow(PI/fLatticeConstant,2.0f)); const float coeff3(2.0f*fKappa*fKappa); const float coeff2(symCorr*coeff3/static_cast(NFFTsqStZ)); const float coeff4(4.0f*pow(PI/fThickness,2.0f)); const float coeff5(1.0f*coeff2); int i, j, k, l, index, index2; float Gsq, ii, kk; // k = 0; for (i = 0; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast(j*j) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j - NFFT)*(j - NFFT)) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { ii = 3.0f*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast(j*j) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j - NFFT)*(j - NFFT)) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast((j+1)*(j+1)) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0f*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast((j+1)*(j+1)) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j+1-NFFT)*(j+1-NFFT)) + ii); fFFTin[fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[fStepsZ*(j + 1 + NFFT*i)][0] *= coeff2/(Gsq+coeff3); fFFTin[fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } fFFTin[0][0] = 0.0f; // k != 0; if (fFind3dSolution) { for (k = 1; k < NFFTz_2; ++k) { kk = coeff4*static_cast(k*k); for (i = 0; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast(j*j) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j - NFFT)*(j - NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { ii = 3.0f*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast(j*j) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j - NFFT)*(j - NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast((j+1)*(j+1)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0f*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast((j+1)*(j+1)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j+1-NFFT)*(j+1-NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } fFFTin[k][0] = 0.0f; } for (k = NFFTz_2; k < NFFTz; ++k) { kk = coeff4*static_cast((k - NFFTz)*(k - NFFTz)); for (i = 0; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast(j*j) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j - NFFT)*(j - NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { ii = 3.0f*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast(j*j) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j - NFFT)*(j - NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast((j+1)*(j+1)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0f*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { Gsq = coeff1*(static_cast((j+1)*(j+1)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { Gsq = coeff1*(static_cast((j+1-NFFT)*(j+1-NFFT)) + ii) + kk; fFFTin[k + fStepsZ*(j + NFFT*i)][0] = 0.0; fFFTin[k + fStepsZ*(j + NFFT*i)][1] = 0.0; fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][0] *= coeff5/(Gsq+coeff3); fFFTin[k + fStepsZ*(j + 1 + NFFT*i)][1] = 0.0; } } fFFTin[k][0] = 0.0f; } /* for (k = NFFTz_2; k < NFFTz; ++k) { #pragma omp parallel for default(shared) private(index) schedule(dynamic) for (index = 0; index < NFFTsq; ++index) { fFFTin[k + NFFTz*index][0] = 0.0; fFFTin[k + NFFTz*index][1] = 0.0; } } */ } // else do nothing since the other coefficients have been zero from the beginning and have not been touched return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsB() const { const int NFFT(fSteps), NFFTsq(fSteps*fSteps), NFFT_2(fSteps/2), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); // Divide EHB's PK by two since we are considering "the full 3D reciprocal lattice", not only the half space! // Additionally treat all K the same (no difference between Kperp and K with Kz != 0) const float coeffKsq(4.0f/3.0f*pow(PI/fLatticeConstant,2.0f)); const float coeffKy(TWOPI/fLatticeConstant); const float coeffKx(coeffKy/sqrt3); const float coeffPk(1.0f/static_cast(fSteps*fSteps*fStepsZ)); const float coeffBkS(2.0f/fThickness); const float coeffKzSq(4.0f*pow(PI/fThickness,2.0f)); int i, j, k, index, index2; float Gsq, ii, kk, kx, ky, sign; // k = 0; for (i = 0; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j); Gsq = coeffKsq*(static_cast(j*j) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j - NFFT); Gsq = coeffKsq*(static_cast((j - NFFT)*(j - NFFT)) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); ii = 3.0*static_cast((i - NFFT)*(i - NFFT)); for (j = 0; j < NFFT_2; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j); Gsq = coeffKsq*(static_cast(j*j) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j - NFFT); Gsq = coeffKsq*(static_cast((j - NFFT)*(j - NFFT)) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1); Gsq = coeffKsq*(static_cast((j + 1)*(j + 1)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1 - NFFT); Gsq = coeffKsq*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index2][1] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); ii = 3.0*static_cast((i - NFFT)*(i - NFFT)); for (j = 0; j < NFFT_2; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1); Gsq = coeffKsq*(static_cast((j + 1)*(j + 1)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1 - NFFT); Gsq = coeffKsq*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(Gsq + 1.0f*fSumSum); fBkMatrix[index2][1] = 0.0; } } fBkMatrix[0][0] = 0.0; // k != 0; if (fFind3dSolution) { sign = 1.f; for (k = 1; k < NFFTz_2; ++k) { sign = -sign; kk = coeffKzSq*static_cast(k*k); for (i = 0; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j); Gsq = coeffKsq*(static_cast(j*j) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j - NFFT); Gsq = coeffKsq*(static_cast((j - NFFT)*(j - NFFT)) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); ii = 3.0*static_cast((i - NFFT)*(i - NFFT)); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j); Gsq = coeffKsq*(static_cast(j*j) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j - NFFT); Gsq = coeffKsq*(static_cast((j - NFFT)*(j - NFFT)) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1); Gsq = coeffKsq*(static_cast((j + 1)*(j + 1)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1 - NFFT); Gsq = coeffKsq*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); ii = 3.0*static_cast((i - NFFT)*(i - NFFT)); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1); Gsq = coeffKsq*(static_cast((j + 1)*(j + 1)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1 - NFFT); Gsq = coeffKsq*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } } fBkMatrix[k][0] = 0.0; } for (k = NFFTz_2; k < NFFTz; ++k) { sign = -sign; kk = coeffKzSq*static_cast((k - NFFTz)*(k - NFFTz)); for (i = 0; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j); Gsq = coeffKsq*(static_cast(j*j) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j - NFFT); Gsq = coeffKsq*(static_cast((j - NFFT)*(j - NFFT)) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } } for (i = NFFT_2; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j); Gsq = coeffKsq*(static_cast(j*j) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j - NFFT); Gsq = coeffKsq*(static_cast((j - NFFT)*(j - NFFT)) + ii); fBkMatrix[index][0] = \ (coeffPk*(ky*fQMatrix[index][1] + kx*fPkMatrix[index][1]) + \ 1.0f*fSumSum*fBkMatrix[index][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = 0.0; fBkMatrix[index2][1] = 0.0; } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ky = coeffKy*static_cast(i); ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1); Gsq = coeffKsq*(static_cast((j+1)*(j+1)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1 - NFFT); Gsq = coeffKsq*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = coeffKy*static_cast(i - NFFT); ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1); Gsq = coeffKsq*(static_cast((j + 1)*(j + 1)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } for (j = NFFT_2; j < NFFT; j += 2) { index = k + NFFTz*(j + NFFT*i); index2 = index + NFFTz; kx = coeffKx*static_cast(j + 1 - NFFT); Gsq = coeffKsq*(static_cast((j + 1 - NFFT)*(j + 1 - NFFT)) + ii); fBkMatrix[index][0] = 0.0; fBkMatrix[index][1] = 0.0; fBkMatrix[index2][0] = \ (coeffPk*(ky*fQMatrix[index2][1] + kx*fPkMatrix[index2][1]) + \ 1.0f*fSumSum*fBkMatrix[index2][0] - sign*coeffBkS*sqrt(Gsq)*fBkS[j + 1 + NFFT*i][0])/(1.0f*(Gsq + kk) + fSumSum); fBkMatrix[index2][1] = 0.0; } } fBkMatrix[k][0] = 0.0; } /* for (k = NFFTz_2; k < NFFTz; ++k) { #pragma omp parallel for default(shared) private(index) schedule(dynamic) for (index = 0; index < NFFTsq; ++index) { fBkMatrix[k + NFFTz*index][0] = 0.0; fBkMatrix[k + NFFTz*index][1] = 0.0; } } */ } else { // for 2D solution only #ifdef HAVE_GOMP int chunk = NFFTsq/omp_get_num_procs(); if (chunk < 10) chunk = 10; #endif for (k = 1; k < NFFTz; ++k) { #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(index) schedule(dynamic,chunk) #endif for (index = 0; index < NFFTsq; ++index) { fBkMatrix[k + NFFTz*index][0] = 0.0; fBkMatrix[k + NFFTz*index][1] = 0.0; } } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForQx() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); const float coeffKy(1.5*fLatticeConstant/PI); int i, j, k; float ii; for (k = 0; k < NFFTz; ++k) { // i = 0 for (j = 0; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*j][0] = 0.0; } for (i = 2; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKy*static_cast(i)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKy*static_cast(i)/(static_cast((j - NFFT)*(j - NFFT)) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKy*static_cast(i-NFFT)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKy*static_cast(i-NFFT)/(static_cast((j - NFFT)*(j - NFFT)) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKy*static_cast(i)/(static_cast((j+1)*(j+1)) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKy*static_cast(i)/(static_cast((j+1-NFFT)*(j+1-NFFT)) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKy*static_cast(i-NFFT)/(static_cast((j+1)*(j+1)) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKy*static_cast(i-NFFT)/(static_cast((j+1-NFFT)*(j+1-NFFT)) + ii); } } if (!fFind3dSolution) { break; // then the following bK are zero anyway } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForQy() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); const float coeffKx(0.5*sqrt3*fLatticeConstant/PI); int i, j, k; float ii; for (k = 0; k < NFFTz; ++k) { for (i = 0; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0; for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast(j)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast(j-NFFT)/(static_cast((j-NFFT)*(j-NFFT)) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0; for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast(j)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffKx*static_cast(j-NFFT)/(static_cast((j-NFFT)*(j-NFFT)) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j+1)/(static_cast((j+1)*(j+1)) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j+1-NFFT)/(static_cast((j+1-NFFT)*(j+1-NFFT)) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j+1)/(static_cast((j+1)*(j+1)) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*(j + 1 + NFFT*i)][0] *= coeffKx*static_cast(j+1-NFFT)/(static_cast((j+1-NFFT)*(j+1-NFFT)) + ii); } } if (!fFind3dSolution) { break; // then the following bK are zero anyway } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForBperpXatSurface() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); int i, j, k; float ii; for (i = 0; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); // j = 0 fBkS[NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j-NFFT)/sqrt(static_cast((j-NFFT)*(j-NFFT)) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); // j = 0 fBkS[NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j-NFFT)/sqrt(static_cast((j-NFFT)*(j-NFFT)) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0f*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j-NFFT)/sqrt(static_cast((j-NFFT)*(j-NFFT)) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 1; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= static_cast(j-NFFT)/sqrt(static_cast((j-NFFT)*(j-NFFT)) + ii); } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForBperpYatSurface() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); int i, j, k; float ii; // i = 0 for (j = 0; j < NFFT; j += 2) { fBkS[j][0] = 0.0f; } for (i = 2; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i)/sqrt(static_cast((j - NFFT)*(j - NFFT)) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 0; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i-NFFT)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i-NFFT)/sqrt(static_cast((j - NFFT)*(j - NFFT)) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i)/sqrt(static_cast((j-NFFT)*(j-NFFT)) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ii = 3.0*static_cast((i-NFFT)*(i-NFFT)); for (j = 1; j < NFFT_2; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i-NFFT)/sqrt(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { fBkS[j + NFFT*i][0] *= sqrt3*static_cast(i-NFFT)/sqrt(static_cast((j-NFFT)*(j-NFFT)) + ii); } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForBperpXFirst() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTsq(fSteps*fSteps), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); const float coeffX(sqrt3*fLatticeConstant/fThickness); int i, j, k, kx, ky, kz, index; float ii; #ifdef HAVE_GOMP int chunk = NFFTsq/omp_get_num_procs(); if (chunk < 10) chunk = 10; #endif // k = 0 #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(index) schedule(dynamic,chunk) #endif for (index = 0; index < NFFTsq; ++index) { fBkMatrix[NFFTz*index][0] = 0.0f; } for (k = 1; k < NFFTz_2; ++k) { for (i = 0; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*k)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*k)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*k)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*k)/(static_cast(kx*kx) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*k)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*k)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*k)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*k)/(static_cast(kx*kx) + ii); } } } for (k = NFFTz_2; k < NFFTz; ++k) { kz = k - NFFTz; for (i = 0; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } } /* for (k = NFFTz_2; k < NFFTz; ++k) { for (index = 0; index < NFFTsq; ++index) { fBkMatrix[k + NFFTz*index][0] = 0.0f; } } */ return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForBperpXSecond() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTsq(fSteps*fSteps), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); const float coeffX(sqrt3*fLatticeConstant/fThickness); int i, j, k, kx, ky, kz, index; float ii; #ifdef HAVE_GOMP int chunk = NFFTsq/omp_get_num_procs(); if (chunk < 10) chunk = 10; #endif // k = 0 #ifdef HAVE_GOMP #pragma omp parallel for default(shared) private(index) schedule(dynamic,chunk) #endif for (index = 0; index < NFFTsq; ++index) { fBkMatrix[NFFTz*index][0] = 0.0f; } for (k = 1; k < NFFTz_2; ++k) { kz = -k; for (i = 0; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } } for (k = NFFTz_2; k < NFFTz; ++k) { kz = NFFTz - k; for (i = 0; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); // j = 0 fBkMatrix[k + NFFTz*NFFT*i][0] = 0.0f; // j != 0 for (j = 2; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(j*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffX*static_cast(kx*kz)/(static_cast(kx*kx) + ii); } } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForBperpYFirst() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTsq(fSteps*fSteps), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); const float coeffY(3.0f*fLatticeConstant/fThickness); int i, j, k, kx, ky, kz, index; float ii; // k = 0 #ifdef HAVE_GOMP int chunk = NFFTsq/omp_get_num_procs(); if (chunk < 10) chunk = 10; #pragma omp parallel for default(shared) private(index) schedule(dynamic,chunk) #endif for (index = 0; index < NFFTsq; ++index) { fBkMatrix[NFFTz*index][0] = 0.0f; } for (k = 1; k < NFFTz_2; ++k) { // i = 0 for (j = 0; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*j][0] = 0.0f; } // i != 0 for (i = 2; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*k)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*k)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*k)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*k)/(static_cast(kx*kx) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*k)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*k)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*k)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*k)/(static_cast(kx*kx) + ii); } } } for (k = NFFTz_2; k < NFFTz; ++k) { kz = k - NFFTz; // i = 0 for (j = 0; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*j][0] = 0.0f; } // i != 0 for (i = 2; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast(kx*kx) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0f*static_cast(ky*ky); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast(kx*kx) + ii); } } } return; } void TFilmTriVortexNGLFieldCalc::ManipulateFourierCoefficientsForBperpYSecond() const { const int NFFT(fSteps), NFFT_2(fSteps/2), NFFTsq(fSteps*fSteps), NFFTz(fStepsZ), NFFTz_2(fStepsZ/2); const float coeffY(3.0f*fLatticeConstant/fThickness); int i, j, k, kx, ky, kz, index; float ii; // k = 0 #ifdef HAVE_GOMP int chunk = NFFTsq/omp_get_num_procs(); if (chunk < 10) chunk = 10; #pragma omp parallel for default(shared) private(index) schedule(dynamic,chunk) #endif for (index = 0; index < NFFTsq; ++index) { fBkMatrix[NFFTz*index][0] = 0.0f; } for (k = 1; k < NFFTz_2; ++k) { kz = -k; // i = 0 for (j = 0; j < NFFT; j += 2) { fBkMatrix[k + NFFTz*j][0] = 0.0f; } // i != 0 for (i = 2; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 0; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast(kx*kx) + ii); } } //intermediate rows for (i = 1; i < NFFT_2; i += 2) { ii = 3.0*static_cast(i*i); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(i*kz)/(static_cast(kx*kx) + ii); } } for (i = NFFT_2 + 1; i < NFFT; i += 2) { ky = i - NFFT; ii = 3.0*static_cast(ky*ky); for (j = 1; j < NFFT_2; j += 2) { fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast(j*j) + ii); } for (j = NFFT_2 + 1; j < NFFT; j += 2) { kx = j - NFFT; fBkMatrix[k + NFFTz*(j + NFFT*i)][0] *= coeffY*static_cast(ky*kz)/(static_cast