Mukesh Kumar e Christopher J Duffy
Explorando o papel do particionamento de domínios na eficiência de simulações de modelos hidrológicos distribuídos em paralelo
Os modelos hidrológicos espacialmente distribuídos de bacias hidrográficas e bacias hidrográficas requerem muitos dados e computação devido à natureza combinada da hidrodinâmica , forçantes complexas e campos de parâmetros heterogéneos. A aplicação destes modelos em resoluções temporais e espaciais finas e em grandes domínios de problemas é facilitada pela computação paralela em clusters de multiprocessadores. Notavelmente, a eficiência computacional das simulações paralelas é determinada de forma crucial pela eficiência com que os dados são divididos e distribuídos num ambiente multiprocessador e como a informação é partilhada entre processadores. Embora existam numerosos algoritmos de particionamento de dados e tenham sido extensivamente estudados na literatura da ciência da computação, a elucidação detalhada do papel da estrutura do modelo hidrológico no particionamento de dados ainda não foi apresentada. Além disso, o papel relativo do equilíbrio de carga computacional e da comunicação entre processadores na eficiência da computação paralela de um modelo hidrológico não é conhecido. Considerando o esquema de discretização de domínios não estruturado utilizado no modelo hidrológico PIHM como exemplo, o artigo apresenta em primeiro lugar uma metodologia genérica para incorporar fatores hidrológicos em algoritmos de particionamento de domínios ótimos. As partições são então utilizadas para explorar o papel isolado do equilíbrio de carga computacional e da comunicação entre processadores na eficiência paralela. Os resultados confirmam que as simulações paralelas em partições que minimizam a comunicação entre processadores e dividem a carga computacional de forma igual são as mais eficientes. Mais importante ainda, observa-se que o equilíbrio de carga entre processadores é um controlo mais sensível da eficiência paralela do que a minimização da comunicação entre processadores. Análises adicionais da eficiência e escalabilidade do código paralelo para diferentes configurações de particionamento revelam uma correspondência direta entre a eficiência paralela e métricas teóricas, como a relação de equilíbrio de carga e a relação comunicação-computação. Os resultados indicam que as métricas teóricas podem ser utilizadas para a seleção das melhores partições antes de serem realizadas simulações paralelas computacionalmente intensivas. O estudo serve como uma avaliação de prova de conceito do impacto da computação e da comunicação na eficiência de modelos hidrológicos distribuídos paralelizados em múltiplas resoluções.