You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
 
 
 
 
 

172 lines
4.1 KiB

#include <iostream>
#include <cstdlib>
#include <cmath>
#include "Ttiming.h"
#include <mpi.h>
#include <stdio.h>
using namespace std;
void array_alloc(long **&arr, long arrsize)
{
try
{
arr = new long* [arrsize];
arr[0] = new long [arrsize*arrsize];
for(long i = 1; i < arrsize; ++i)
arr[i] = arr[i-1] + arrsize;
}
catch (bad_alloc& ex)
{
cerr << "Could not allocate memory for array" << endl;
exit(1);
}
}
void vect_alloc(long *&arr, long arrsize)
{
try
{
arr = new long [arrsize];
}
catch (bad_alloc& ex)
{
cerr << "Could not allocate memory for vector" << endl;
exit(1);
}
}
int main(int argc, char *argv[])
{
long **A=NULL, **B=NULL, *B_rot=NULL, *vect=NULL, *vect_c=NULL, *C_rot=NULL;
long rozmiar=0, porcja_new=0, buff_max=0;
char *endptr;
TTiming tt;
long i;
MPI::Status status;
if (argc < 2)
{
cerr << "Usage: " << argv[0] << " <size>" << endl;
exit(1);
}
rozmiar = strtol(argv[1], &endptr, 10);
if (*endptr)
{
cerr << "Invalid array size format" << endl;
exit(1);
}
if (rozmiar <= 0)
{
cerr << "The number of matrix dimension must be positive" << endl;
exit(1);
}
MPI::Init(argc, argv);
int taskid = MPI::COMM_WORLD.Get_rank();
int ntasks = MPI::COMM_WORLD.Get_size();
//alokacja macierzy
array_alloc(A, rozmiar);
if (taskid == 0)
{
array_alloc(B, rozmiar);
vect_alloc(B_rot, rozmiar*rozmiar);
}
// porcja - ile wektorów dostaje jeden proces do liczenia
// jeżeli liczba procesów większa od wektorów - każdy proces dostaje po jednym, niektóre wcale
long porcja = (rozmiar>=ntasks) ? (long)round(rozmiar*1.0/ntasks) : 1;
porcja *= rozmiar; //porcję mnożymy przez ilość elementów w jednym wektorze
porcja_new = porcja;
// dla kompatybilności liczę jeszcze rozmiar bufora odbioru,
// np. jeżeli chunki będą jednolitego rozmiaru, a ostatni będzie większy
// to bufor odbioru musi być zwiększony (żeby go nie ucinało)
buff_max = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;
if (porcja > buff_max)
buff_max = porcja; // na wypadek, jeżeli jednak ostatni kawałek będzie mniejszy
if (taskid == 0)
vect_alloc(C_rot, ntasks*buff_max);
vect_alloc(vect, porcja);
vect_alloc(vect_c, buff_max);
if (taskid == 0)
{
// wypełnienie macierzy A liczbami "losowymi"
for (long i=0; i<rozmiar; ++i)
for (long j=0; j<rozmiar; ++j)
//A[i][j] = 3*i+j+1; //test
A[i][j] = (long)(sin(i) * i * j) % 10;
// wypełnienie macierzy B liczbami "losowymi"
for (long i=0; i<rozmiar; ++i)
for (long j=0; j<rozmiar; ++j)
//B[i][j] = j; //test
B[i][j] = (long)(cos(j) *(i+j)) % 10;
// dokonaj obracania macierzy
for (long i=0; i<rozmiar; ++i)
for (long j=0; j<rozmiar; ++j)
B_rot[i*rozmiar+j] = B[j][i];
}
//wysyłanie macierzy A do wszystkich
MPI::COMM_WORLD.Bcast(&A[0][0], rozmiar*rozmiar, MPI::LONG, 0);
MPI::COMM_WORLD.Barrier();
//dla wszystkich lub "rozmiar" procesów należy zadać porcję do obliczenia
MPI::COMM_WORLD.Scatter(&B_rot[0], porcja, MPI::LONG, &vect[0], porcja, MPI::LONG, 0);
//
// część licząca ---------------------------------------------------------------------------------
//
MPI::COMM_WORLD.Barrier();
if (taskid == 0)
tt.Begin();
if (taskid == ntasks -1) //przelicz porcję dla ostatniego procesu (w przypadku dzielenia z resztą)
{
porcja_new = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;
// myk jest taki, że muszę podać jakąś niezerową porcję do gathera,
// mimo, że proces nie ma żadnych (sensownych) danych do przetworzenia
if (porcja_new > 0)
porcja = porcja_new;
}
for (i=0; i<porcja_new; ++i)
{
vect_c[i] = 0;
long a_row = i%rozmiar;
long vect_col = (i/rozmiar)*rozmiar;
for (long k=0; k<rozmiar; ++k)
{
vect_c[i] += A[a_row][k]*vect[vect_col];
++vect_col;
}
}
MPI::COMM_WORLD.Barrier();
if (taskid == 0)
{
long elapsed = tt.End();
cout << "Time: " << elapsed << " ms" << endl;
}
// zwróć wszystko do programu głównego
MPI::COMM_WORLD.Gather(&vect_c[0], buff_max, MPI::LONG, &C_rot[0], buff_max, MPI::LONG, 0);
MPI::Finalize();
exit(0);
}