pioder
/
prir

#include <iostream>
#include <cstdlib>
#include <cmath>
#include "Ttiming.h"
#include <mpi.h>
#include <stdio.h>

using namespace std;
void array_alloc(long **&arr, long arrsize){	try	{			arr = new long* [arrsize];			arr[0] = new long [arrsize*arrsize];			for(long i = 1; i < arrsize; ++i)			arr[i] = arr[i-1] + arrsize;	}	catch (bad_alloc& ex)	{		cerr << "Could not allocate memory for array" << endl;		exit(1);	}}
void vect_alloc(long *&arr, long arrsize){	try	{			arr = new long [arrsize];		}	catch (bad_alloc& ex)	{		cerr << "Could not allocate memory for vector" << endl;		exit(1);	}}
int main(int argc, char *argv[]){	long **A=NULL, **B=NULL, *B_rot=NULL, *vect=NULL, *vect_c=NULL, *C_rot=NULL;	long rozmiar=0, porcja_new=0, buff_max=0;	char *endptr;	TTiming tt;	long i;	MPI::Status  status;
	if (argc < 2)	{		cerr << "Usage: " << argv[0] << " <size>" << endl;		exit(1);	}		rozmiar = strtol(argv[1], &endptr, 10);		if (*endptr)	{		cerr << "Invalid array size format" << endl;		exit(1);	}	  
	if (rozmiar <= 0)	{		cerr << "The number of matrix dimension must be positive" << endl;		exit(1);	}	  	MPI::Init(argc, argv);
	int taskid = MPI::COMM_WORLD.Get_rank();	int ntasks = MPI::COMM_WORLD.Get_size();
	//alokacja macierzy
	array_alloc(A, rozmiar);	if (taskid == 0) 	{		array_alloc(B, rozmiar);		vect_alloc(B_rot, rozmiar*rozmiar);
	}
	// porcja - ile wektorów dostaje jeden proces do liczenia
	// jeżeli liczba procesów większa od wektorów - każdy proces dostaje po jednym, niektóre wcale
	long porcja = (rozmiar>=ntasks) ? (long)round(rozmiar*1.0/ntasks) : 1;	porcja *= rozmiar; //porcję mnożymy przez ilość elementów w jednym wektorze
	porcja_new = porcja;
	// dla kompatybilności liczę jeszcze rozmiar bufora odbioru,
	// np. jeżeli chunki będą jednolitego rozmiaru, a ostatni będzie większy
	// to bufor odbioru musi być zwiększony (żeby go nie ucinało)
	buff_max = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;	if (porcja > buff_max)		buff_max = porcja; // na wypadek, jeżeli jednak ostatni kawałek będzie mniejszy 
		if (taskid == 0)		vect_alloc(C_rot, ntasks*buff_max);
	vect_alloc(vect, porcja);	vect_alloc(vect_c, buff_max);	if (taskid == 0)	{		// wypełnienie macierzy A liczbami "losowymi"
		for (long i=0; i<rozmiar; ++i)			for (long j=0; j<rozmiar; ++j)				//A[i][j] = 3*i+j+1; //test
				A[i][j] = (long)(sin(i) * i * j) % 10;					// wypełnienie macierzy B liczbami "losowymi"
		for (long i=0; i<rozmiar; ++i)			for (long j=0; j<rozmiar; ++j)				//B[i][j] = j; //test
				B[i][j] = (long)(cos(j) *(i+j)) % 10;						// dokonaj obracania macierzy
		for (long i=0; i<rozmiar; ++i)			for (long j=0; j<rozmiar; ++j)				B_rot[i*rozmiar+j] = B[j][i];	}		//wysyłanie macierzy A do wszystkich
	MPI::COMM_WORLD.Bcast(&A[0][0], rozmiar*rozmiar, MPI::LONG, 0);
	MPI::COMM_WORLD.Barrier();
	//dla wszystkich lub "rozmiar" procesów należy zadać porcję do obliczenia
	MPI::COMM_WORLD.Scatter(&B_rot[0], porcja, MPI::LONG, &vect[0], porcja, MPI::LONG, 0);		//
	// część licząca ---------------------------------------------------------------------------------
	//
		MPI::COMM_WORLD.Barrier();	if (taskid == 0)		tt.Begin();
	if (taskid == ntasks -1) //przelicz porcję dla ostatniego procesu (w przypadku dzielenia z resztą)
	{		porcja_new = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;				// myk jest taki, że muszę podać jakąś niezerową porcję do gathera,
		// mimo, że proces nie ma żadnych (sensownych) danych do przetworzenia
		if (porcja_new > 0)			porcja = porcja_new;	}
	for (i=0; i<porcja_new; ++i)	{		vect_c[i] = 0;		long a_row = i%rozmiar;		long vect_col = (i/rozmiar)*rozmiar;		for (long k=0; k<rozmiar; ++k)		{			vect_c[i] += A[a_row][k]*vect[vect_col];			++vect_col;		}	}		MPI::COMM_WORLD.Barrier();	if (taskid == 0)	{		long elapsed = tt.End();			cout << "Time: " << elapsed << " ms" << endl;	}		// zwróć wszystko do programu głównego
	MPI::COMM_WORLD.Gather(&vect_c[0], buff_max, MPI::LONG, &C_rot[0], buff_max, MPI::LONG, 0);		MPI::Finalize();		exit(0);}