|
|
- #include <iostream>
- #include <cstdlib>
- #include <cmath>
- #include "Ttiming.h"
- #include <mpi.h>
- #include <stdio.h>
-
- using namespace std;
-
- void array_alloc(long **&arr, long arrsize)
- {
- try
- {
- arr = new long* [arrsize];
- arr[0] = new long [arrsize*arrsize];
-
- for(long i = 1; i < arrsize; ++i)
- arr[i] = arr[i-1] + arrsize;
- }
- catch (bad_alloc& ex)
- {
- cerr << "Could not allocate memory for array" << endl;
- exit(1);
- }
- }
-
- void vect_alloc(long *&arr, long arrsize)
- {
- try
- {
- arr = new long [arrsize];
- }
- catch (bad_alloc& ex)
- {
- cerr << "Could not allocate memory for vector" << endl;
- exit(1);
- }
- }
-
- int main(int argc, char *argv[])
- {
- long **A=NULL, **B=NULL, *B_rot=NULL, *vect=NULL, *vect_c=NULL, *C_rot=NULL;
- long rozmiar=0, porcja_new=0, buff_max=0;
- char *endptr;
- TTiming tt;
- long i;
- MPI::Status status;
-
- if (argc < 2)
- {
- cerr << "Usage: " << argv[0] << " <size>" << endl;
- exit(1);
- }
-
- rozmiar = strtol(argv[1], &endptr, 10);
-
- if (*endptr)
- {
- cerr << "Invalid array size format" << endl;
- exit(1);
- }
-
- if (rozmiar <= 0)
- {
- cerr << "The number of matrix dimension must be positive" << endl;
- exit(1);
- }
-
- MPI::Init(argc, argv);
-
- int taskid = MPI::COMM_WORLD.Get_rank();
- int ntasks = MPI::COMM_WORLD.Get_size();
-
- //alokacja macierzy
- array_alloc(A, rozmiar);
- if (taskid == 0)
- {
- array_alloc(B, rozmiar);
- vect_alloc(B_rot, rozmiar*rozmiar);
-
- }
-
- // porcja - ile wektorów dostaje jeden proces do liczenia
- // jeżeli liczba procesów większa od wektorów - każdy proces dostaje po jednym, niektóre wcale
- long porcja = (rozmiar>=ntasks) ? (long)round(rozmiar*1.0/ntasks) : 1;
- porcja *= rozmiar; //porcję mnożymy przez ilość elementów w jednym wektorze
- porcja_new = porcja;
-
- // dla kompatybilności liczę jeszcze rozmiar bufora odbioru,
- // np. jeżeli chunki będą jednolitego rozmiaru, a ostatni będzie większy
- // to bufor odbioru musi być zwiększony (żeby go nie ucinało)
- buff_max = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;
- if (porcja > buff_max)
- buff_max = porcja; // na wypadek, jeżeli jednak ostatni kawałek będzie mniejszy
-
- if (taskid == 0)
- vect_alloc(C_rot, ntasks*buff_max);
-
- vect_alloc(vect, porcja);
- vect_alloc(vect_c, buff_max);
- if (taskid == 0)
- {
- // wypełnienie macierzy A liczbami "losowymi"
- for (long i=0; i<rozmiar; ++i)
- for (long j=0; j<rozmiar; ++j)
- //A[i][j] = 3*i+j+1; //test
- A[i][j] = (long)(sin(i) * i * j) % 10;
-
- // wypełnienie macierzy B liczbami "losowymi"
- for (long i=0; i<rozmiar; ++i)
- for (long j=0; j<rozmiar; ++j)
- //B[i][j] = j; //test
- B[i][j] = (long)(cos(j) *(i+j)) % 10;
-
- // dokonaj obracania macierzy
- for (long i=0; i<rozmiar; ++i)
- for (long j=0; j<rozmiar; ++j)
- B_rot[i*rozmiar+j] = B[j][i];
- }
-
- //wysyłanie macierzy A do wszystkich
- MPI::COMM_WORLD.Bcast(&A[0][0], rozmiar*rozmiar, MPI::LONG, 0);
-
- MPI::COMM_WORLD.Barrier();
-
- //dla wszystkich lub "rozmiar" procesów należy zadać porcję do obliczenia
- MPI::COMM_WORLD.Scatter(&B_rot[0], porcja, MPI::LONG, &vect[0], porcja, MPI::LONG, 0);
-
- //
- // część licząca ---------------------------------------------------------------------------------
- //
-
- MPI::COMM_WORLD.Barrier();
- if (taskid == 0)
- tt.Begin();
-
- if (taskid == ntasks -1) //przelicz porcję dla ostatniego procesu (w przypadku dzielenia z resztą)
- {
- porcja_new = (rozmiar - (porcja/rozmiar)*(ntasks-1))*rozmiar;
-
- // myk jest taki, że muszę podać jakąś niezerową porcję do gathera,
- // mimo, że proces nie ma żadnych (sensownych) danych do przetworzenia
- if (porcja_new > 0)
- porcja = porcja_new;
- }
-
- for (i=0; i<porcja_new; ++i)
- {
- vect_c[i] = 0;
- long a_row = i%rozmiar;
- long vect_col = (i/rozmiar)*rozmiar;
- for (long k=0; k<rozmiar; ++k)
- {
- vect_c[i] += A[a_row][k]*vect[vect_col];
- ++vect_col;
- }
- }
-
- MPI::COMM_WORLD.Barrier();
- if (taskid == 0)
- {
- long elapsed = tt.End();
- cout << "Time: " << elapsed << " ms" << endl;
- }
-
- // zwróć wszystko do programu głównego
- MPI::COMM_WORLD.Gather(&vect_c[0], buff_max, MPI::LONG, &C_rot[0], buff_max, MPI::LONG, 0);
-
- MPI::Finalize();
-
- exit(0);
- }
|