東京大学 助教 星野 哲也 先生にご執筆いただいているGPUコラム「OpenACCではじめるGPUプログラミング」は、中級編 第4回を掲載しました。MPI+OpenACC実装における計算と通信のオーバーラップ についてです。
本文
前回はMPI + OpenACCによる拡散方程式のマルチGPU実装を行いましたが、性能向上できたのは4GPUまでで、8GPUでは逆に遅くなってしまったのでした。
今回はより高速化するためにはどうしたらいいのかについて解説していきます。
お気軽にお問い合わせください。03-5802-7050受付時間 9:00-18:00 [ 土・日・祝日除く ]
東京大学 助教 星野 哲也 先生にご執筆いただいているGPUコラム「OpenACCではじめるGPUプログラミング」は、中級編 第4回を掲載しました。MPI+OpenACC実装における計算と通信のオーバーラップ についてです。
本文
前回はMPI + OpenACCによる拡散方程式のマルチGPU実装を行いましたが、性能向上できたのは4GPUまでで、8GPUでは逆に遅くなってしまったのでした。
今回はより高速化するためにはどうしたらいいのかについて解説していきます。