/* parallelgradgsl.cpp - parallel implementation (using openmp) of gradgsl.h Copyright (C) 2010 Rui Rodrigues This software is released under the terms of the GNU General Public License (http://www.gnu.org/copyleft/gpl.html). */ #include "gradgsl.h" #include //#include #include #ifdef _OPENMP #include #endif using namespace std; //---------------------------------------parametersfwdgsl---------------------------------------------------------------------- //constructor parametersfwdgsl::parametersfwdgsl(int Numhiddenlayers, int*Dimensions,int Batchsize){ //dimensions is an array with numhiddenlayers+2 elements: ninputs,nhid0,nhid1,...,nhid_numhiddenlayers=noutputs numhidlayers=Numhiddenlayers; batchsize=Batchsize; dimensions=Dimensions; ninputs=dimensions[0]; tam=new int[numhidlayers+1]; tamtotal=0; for(int i=0;idata; //fill w[hid] for(int hid=0;hiddata; //fill w[hid] for(int hid=0;hiddata, T.batchsize*T.dimensions[numhidlayers+1]); //euclidean norm double error=gsl_blas_dnrm2 (&vectorimagedata.vector); return error; } //to make a blacklist of patches where the error excedes a limit void give_error_for_each_patch_gsl_vislinear(const gsl_vector * x,void * td,gsl_matrix*batchoutputdata,double*errorforpatch) { parametersfwdgsl*tad=(parametersfwdgsl*) td; parametersfwdgsl & T=*tad; int numhidlayers=T.numhidlayers; //initial data double *xdata=x->data; //fill w[hid] for(int hid=0;hidsize1;++i){ rowview= gsl_matrix_row (T.fwd_data,i); errorforpatch[i]=gsl_blas_dnrm2 (&rowview.vector); } } //------------------------------------------------------------------------------ double compute_error_gsl_vislinear(const gsl_vector * x,void * td) { parametersgradgsl*tad=(parametersgradgsl*) td; parametersgradgsl & T=*tad; int numhidlayers=T.numhidlayers; //initial data double *xdata=x->data; //fill w[hid] for(int hid=0;hiddata; //fill w[hid], bias[hid] for(int hid=0;hiddata+start, T.dimensions[i]+1, T.dimensions[i+1]); start+=(T.dimensions[i]+1)*T.dimensions[i+1]; } //--------------------just matrix views to be able to use openmp----------------------------------------------------- #ifdef _OPENMP int maxnumthreads = omp_get_max_threads(); #else /* _OPENMP */ int maxnumthreads = 1; #endif /* _OPENMP */ const int blocksize=T.batchsize/maxnumthreads; //sizesblocks---- int *sizesblocks=new int[maxnumthreads]; for(int i=0;i-1;--hid){ gsl_matrix_memcpy (&blockaux1[thread*numhidlayers+hid].matrix, &blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); gsl_matrix_scale (&blockaux1[thread*numhidlayers+hid].matrix, -1.0); gsl_matrix_add_constant (&blockaux1[thread*numhidlayers+hid].matrix, 1.0); gsl_matrix_mul_elements (&blockaux1[thread*numhidlayers+hid].matrix, &blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); gsl_blas_dgemm(CblasNoTrans, CblasTrans, 1.0, &blockaux2[thread*(numhidlayers+1)+hid+1].matrix, &T.a[hid+1].matrix, 0.0, &blockaux2[thread*(numhidlayers+1)+hid].matrix); gsl_matrix_mul_elements (&blockaux2[thread*(numhidlayers+1)+hid].matrix,&blockaux1[thread*numhidlayers+hid].matrix); } } //update gradients outside the big cycle gsl_blas_dgemm(CblasTrans, CblasNoTrans, 1.0, T.layerdata[numhidlayers], &T.matrixlastlayer.matrix, 0.0, &T.dw[numhidlayers].matrix); for(int hid=numhidlayers-1;hid>-1;--hid) gsl_blas_dgemm(CblasTrans, CblasNoTrans, 1.0, T.layerdata[hid], T.aux2[hid], 0.0, &T.dw[hid].matrix); //delete [] blockdw; delete [] blockaux1; delete [] blockaux2; delete [] blocklayerdata; delete [] blockreallayerdata; delete [] blockoutputdata; delete [] sizesblocks; } //--------------------------------------------------------------------------------------------------------------------------------- void errorandgrad_vislinear(const gsl_vector* x,void*td, double * error, gsl_vector *grad){ parametersgradgsl*tad=(parametersgradgsl*) td; parametersgradgsl & T=*tad; int numhidlayers=T.numhidlayers; //initial data double *xdata=x->data; //fill w[hid], bias[hid] for(int hid=0;hiddata+start, T.dimensions[i]+1, T.dimensions[i+1]); start+=(T.dimensions[i]+1)*T.dimensions[i+1]; } //--------------------just matrix views to be able to use openmp----------------------------------------------------- #ifdef _OPENMP int maxnumthreads = omp_get_max_threads(); #else /* _OPENMP */ int maxnumthreads = 1; #endif /* _OPENMP */ const int blocksize=T.batchsize/maxnumthreads; //sizesblocks---- int *sizesblocks=new int[maxnumthreads]; for(int i=0;i-1;--hid){ gsl_matrix_memcpy (&blockaux1[thread*numhidlayers+hid].matrix, &blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); gsl_matrix_scale (&blockaux1[thread*numhidlayers+hid].matrix, -1.0); gsl_matrix_add_constant (&blockaux1[thread*numhidlayers+hid].matrix, 1.0); gsl_matrix_mul_elements (&blockaux1[thread*numhidlayers+hid].matrix, &blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); gsl_blas_dgemm(CblasNoTrans, CblasTrans, 1.0, &blockaux2[thread*(numhidlayers+1)+hid+1].matrix, &T.a[hid+1].matrix, 0.0, &blockaux2[thread*(numhidlayers+1)+hid].matrix); gsl_matrix_mul_elements (&blockaux2[thread*(numhidlayers+1)+hid].matrix,&blockaux1[thread*numhidlayers+hid].matrix); } } //update gradients outside the big cycle gsl_blas_dgemm(CblasTrans, CblasNoTrans, 1.0, T.layerdata[numhidlayers], &T.matrixlastlayer.matrix, 0.0, &T.dw[numhidlayers].matrix); for(int hid=numhidlayers-1;hid>-1;--hid) gsl_blas_dgemm(CblasTrans, CblasNoTrans, 1.0, T.layerdata[hid], T.aux2[hid], 0.0, &T.dw[hid].matrix); //euclidean norm *error=gsl_blas_dnrm2 (T.lastlayer); delete [] blockaux1; delete [] blockaux2; delete [] blocklayerdata; delete [] blockreallayerdata; delete [] blockoutputdata; delete [] sizesblocks; } //------------------------------------------------------------------------------------------------ //when the activation of last layer is logistic (and not the identity) --------------------------- //________________________________________________________________________________________________ void fwdgsl_vislogistic(const gsl_vector * x,void * td,gsl_matrix*imagedata){ parametersfwdgsl*tad=(parametersfwdgsl*) td; parametersfwdgsl & T=*tad; int numhidlayers=T.numhidlayers; //_____________________________________________________________________________________ //openmp // #ifdef _OPENMP int maxnumthreads = omp_get_max_threads(); #else /* _OPENMP */ int maxnumthreads = 1; #endif /* _OPENMP */ const int blocksize=T.batchsize/maxnumthreads; cout<<"maxnumthreads is "<data; //fill w[hid] for(int hid=0;hiddata; //fill w[hid] for(int hid=0;hiddata, T.batchsize*T.dimensions[numhidlayers+1]); //euclidean norm double error=gsl_blas_dnrm2 (&vectorimagedata.vector); return error; } double compute_error_gsl_vislogistic(const gsl_vector * x,void * td) { parametersgradgsl*tad=(parametersgradgsl*) td; parametersgradgsl & T=*tad; int numhidlayers=T.numhidlayers; //initial data double *xdata=x->data; //fill w[hid] for(int hid=0;hiddata; //fill w[hid], bias[hid] for(int hid=0;hiddata+start, T.dimensions[i]+1, T.dimensions[i+1]); start+=(T.dimensions[i]+1)*T.dimensions[i+1]; } //--------------------just matrix views to be able to use openmp----------------------------------------------------- #ifdef _OPENMP int maxnumthreads = omp_get_max_threads(); #else /* _OPENMP */ int maxnumthreads = 1; #endif /* _OPENMP */ const int blocksize=T.batchsize/maxnumthreads; //sizesblocks---- int *sizesblocks=new int[maxnumthreads]; for(int i=0;i-1;--hid){ gsl_matrix_memcpy (&blockaux1[thread*numhidlayers+hid].matrix,&blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); gsl_matrix_scale (&blockaux1[thread*numhidlayers+hid].matrix, -1.0); gsl_matrix_add_constant (&blockaux1[thread*numhidlayers+hid].matrix, 1.0); gsl_matrix_mul_elements (&blockaux1[thread*numhidlayers+hid].matrix,&blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); gsl_blas_dgemm(CblasNoTrans, CblasTrans, 1.0, &blockaux2[thread*(numhidlayers+1)+hid+1].matrix, &T.a[hid+1].matrix, 0.0, &blockaux2[thread*(numhidlayers+1)+hid].matrix); gsl_matrix_mul_elements (&blockaux2[thread*(numhidlayers+1)+hid].matrix,&blockaux1[thread*numhidlayers+hid].matrix); } } //update gradients outside the big cycle for(int hid=numhidlayers;hid>-1;--hid) gsl_blas_dgemm(CblasTrans, CblasNoTrans, 1.0, T.layerdata[hid], T.aux2[hid], 0.0, &T.dw[hid].matrix); //delete [] blockdw; delete [] blockaux1; delete [] blockaux2; delete [] blocklayerdata; delete [] blockreallayerdata; delete [] blockoutputdata; delete [] sizesblocks; delete [] blocklastlayerdata_matrix; } //---------------------------------------------------------------------------------------------------- void errorandgrad_vislogistic(const gsl_vector* x,void*td, double * error, gsl_vector *grad){ parametersgradgsl*tad=(parametersgradgsl*) td; parametersgradgsl & T=*tad; int numhidlayers=T.numhidlayers; //initial data double *xdata=x->data; //fill w[hid], bias[hid] for(int hid=0;hiddata+start, T.dimensions[i]+1, T.dimensions[i+1]); start+=(T.dimensions[i]+1)*T.dimensions[i+1]; } //--------------------just matrix views to be able to use openmp----------------------------------------------------- #ifdef _OPENMP int maxnumthreads = omp_get_max_threads(); #else /* _OPENMP */ int maxnumthreads = 1; #endif /* _OPENMP */ const int blocksize=T.batchsize/maxnumthreads; //sizesblocks---- int *sizesblocks=new int[maxnumthreads]; for(int i=0;i-1;--hid){ gsl_matrix_memcpy (&blockaux1[thread*numhidlayers+hid].matrix,&blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); //gsl_matrix_memcpy (T.aux1[hid],&T.reallayerdata[hid+1].matrix); gsl_matrix_scale (&blockaux1[thread*numhidlayers+hid].matrix, -1.0); //gsl_matrix_scale (T.aux1[hid], -1.0); gsl_matrix_add_constant (&blockaux1[thread*numhidlayers+hid].matrix, 1.0); //gsl_matrix_add_constant (T.aux1[hid], 1.0); gsl_matrix_mul_elements (&blockaux1[thread*numhidlayers+hid].matrix,&blockreallayerdata[thread*(numhidlayers+1)+hid+1].matrix); //gsl_matrix_mul_elements (T.aux1[hid],&T.reallayerdata[hid+1].matrix); gsl_blas_dgemm(CblasNoTrans, CblasTrans, 1.0, &blockaux2[thread*(numhidlayers+1)+hid+1].matrix, &T.a[hid+1].matrix, 0.0, &blockaux2[thread*(numhidlayers+1)+hid].matrix); //gsl_blas_dgemm(CblasNoTrans, CblasTrans, // 1.0, T.aux2[hid+1], &T.a[hid+1].matrix, // 0.0, T.aux2[hid]); gsl_matrix_mul_elements (&blockaux2[thread*(numhidlayers+1)+hid].matrix,&blockaux1[thread*numhidlayers+hid].matrix); //gsl_matrix_mul_elements (T.aux2[hid],T.aux1[hid]);//result goes to aux2 } } //update gradients outside the big cycle //gsl_blas_dgemm(CblasTrans, CblasNoTrans, // 1.0, T.layerdata[numhidlayers], &T.aux2[numhidlayers].matrix, // 0.0, &T.dw[numhidlayers].matrix); for(int hid=numhidlayers;hid>-1;--hid) gsl_blas_dgemm(CblasTrans, CblasNoTrans, 1.0, T.layerdata[hid], T.aux2[hid], 0.0, &T.dw[hid].matrix); //scalar error *error=gsl_blas_dnrm2 (T.lastlayer); //delete [] blockdw; delete [] blockaux1; delete [] blockaux2; delete [] blocklayerdata; delete [] blockreallayerdata; delete [] blockoutputdata; delete [] sizesblocks; delete [] blocklastlayerdata_matrix; }