pioder
/
prir


								#include <iostream>

								#include <cstdlib>

								#include <cmath>

								#include "Ttiming.h"

								#include <mpi.h>

								#include <stdio.h>


								using namespace std;


								void array_alloc(long **&arr, long arrsize)

								{

									try

									{

										arr = new long* [arrsize];

										arr[0] = new long [arrsize*arrsize];


										for(long i = 1; i < arrsize; ++i)

											arr[i] = arr[i-1] + arrsize;

									}

									catch (bad_alloc& ex)

									{

										cerr << "Could not allocate memory for array" << endl;

										exit(1);

									}

								}


								void vect_alloc(long *&arr, long arrsize)

								{

									try

									{

										arr = new long [arrsize];

									}

									catch (bad_alloc& ex)

									{

										cerr << "Could not allocate memory for vector" << endl;

										exit(1);

									}

								}


								int main(int argc, char *argv[])

								{

									long **A=NULL, **B=NULL, *B_rot=NULL, *vect=NULL, *vect_c=NULL, *C_rot=NULL;

									long rozmiar=0, porcja_new=0, buff_max=0;

									char *endptr;

									TTiming tt;

									long i;

									MPI::Status  status;


									if (argc < 2)

									{

										cerr << "Usage: " << argv[0] << " <size>" << endl;

										exit(1);

									}


									rozmiar = strtol(argv[1], &endptr, 10);


									if (*endptr)

									{

										cerr << "Invalid array size format" << endl;

										exit(1);

									}


									if (rozmiar <= 0)

									{

										cerr << "The number of matrix dimension must be positive" << endl;

										exit(1);

									}


									MPI::Init(argc, argv);


									int taskid = MPI::COMM_WORLD.Get_rank();

									int ntasks = MPI::COMM_WORLD.Get_size();


									//alokacja macierzy

									array_alloc(A, rozmiar);

									if (taskid == 0)

									{

										array_alloc(B, rozmiar);

										vect_alloc(B_rot, rozmiar*rozmiar);


									}


									// porcja - ile wektorów dostaje jeden proces do liczenia

									// jeżeli liczba procesów większa od wektorów - każdy proces dostaje po jednym, niektóre wcale

									long porcja = (rozmiar>=ntasks) ? (long)round(rozmiar*1.0/ntasks) : 1;

									porcja *= rozmiar; //porcję mnożymy przez ilość elementów w jednym wektorze

									porcja_new = porcja;


									// dla kompatybilności liczę jeszcze rozmiar bufora odbioru,

									// np. jeżeli chunki będą jednolitego rozmiaru, a ostatni będzie większy

									// to bufor odbioru musi być zwiększony (żeby go nie ucinało)

									buff_max = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;

									if (porcja > buff_max)

										buff_max = porcja; // na wypadek, jeżeli jednak ostatni kawałek będzie mniejszy


									if (taskid == 0)

										vect_alloc(C_rot, ntasks*buff_max);


									vect_alloc(vect, porcja);

									vect_alloc(vect_c, buff_max);

									if (taskid == 0)

									{

										// wypełnienie macierzy A liczbami "losowymi"

										for (long i=0; i<rozmiar; ++i)

											for (long j=0; j<rozmiar; ++j)

												//A[i][j] = 3*i+j+1; //test

												A[i][j] = (long)(sin(i) * i * j) % 10;


										// wypełnienie macierzy B liczbami "losowymi"

										for (long i=0; i<rozmiar; ++i)

											for (long j=0; j<rozmiar; ++j)

												//B[i][j] = j; //test

												B[i][j] = (long)(cos(j) *(i+j)) % 10;


										// dokonaj obracania macierzy

										for (long i=0; i<rozmiar; ++i)

											for (long j=0; j<rozmiar; ++j)

												B_rot[i*rozmiar+j] = B[j][i];

									}


									//wysyłanie macierzy A do wszystkich

									MPI::COMM_WORLD.Bcast(&A[0][0], rozmiar*rozmiar, MPI::LONG, 0);


									MPI::COMM_WORLD.Barrier();


									//dla wszystkich lub "rozmiar" procesów należy zadać porcję do obliczenia

									MPI::COMM_WORLD.Scatter(&B_rot[0], porcja, MPI::LONG, &vect[0], porcja, MPI::LONG, 0);


									//

									// część licząca ---------------------------------------------------------------------------------

									//


									MPI::COMM_WORLD.Barrier();

									if (taskid == 0)

										tt.Begin();


									if (taskid == ntasks -1) //przelicz porcję dla ostatniego procesu (w przypadku dzielenia z resztą)

									{

										porcja_new = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;


										// myk jest taki, że muszę podać jakąś niezerową porcję do gathera,

										// mimo, że proces nie ma żadnych (sensownych) danych do przetworzenia

										if (porcja_new > 0)

											porcja = porcja_new;

									}


									for (i=0; i<porcja_new; ++i)

									{

										vect_c[i] = 0;

										long a_row = i%rozmiar;

										long vect_col = (i/rozmiar)*rozmiar;

										for (long k=0; k<rozmiar; ++k)

										{

											vect_c[i] += A[a_row][k]*vect[vect_col];

											++vect_col;

										}

									}


									MPI::COMM_WORLD.Barrier();

									if (taskid == 0)

									{

										long elapsed = tt.End();

										cout << "Time: " << elapsed << " ms" << endl;

									}


									// zwróć wszystko do programu głównego

									MPI::COMM_WORLD.Gather(&vect_c[0], buff_max, MPI::LONG, &C_rot[0], buff_max, MPI::LONG, 0);


									MPI::Finalize();


									exit(0);

								}