dcmodel ミーティング記録(2014/05/26)
参加者
- 北大
- 石渡
- 神戸大
- 林, 高橋, 村上, 河合, 船橋
- 理研 AICS
- 西澤
- 宇宙研
- 樫村
- 九大
- 中島
- 京大
- 石岡, 佐々木, 竹広
ISPACK2 の開発に向けて (石岡)
- ベクトル機向けの実装(stpack)
- いちばん内側のループ, 普通はガウス緯度の方向
- 当時は T42 程度の解像度⇒ベクトル長が稼げなかった
- そこでいちばん内側のループを東西波数に関して回すようにした
- OpenMP などのスレッド並列になじまない
- Intel CPU (スカラー機)向けの実装(sjpack)
- キャッシュの有効利用がポイント
- 多層モデルを前提にして行列積の形にする手もあったが, 一層モデルで速くすることを目指した
- ルジャンドル陪函数の漸化式計算に工夫を施した
- SSE2 命令の利用, ホットスポットをアセンブラでかいた
- AVX 命令に対応
- GPGPU 対応も試みたが, バス転送に時間がかかりあまり速度が上がらなかった
- ISPACK2
- 開発の動機
- ES2 上での ISPACK/SPMODEL の計算速度が sjpack では上がらない
- Xeon Phi, Intel Broadwell 等大きなベクトル計算ができそう
- 開発方針
- FFT ベクトル計算は複数データ同時処理に用いつつ AVX 対応
- ルジャンドル変換計算は sjpack を踏襲
- 英語マニュアル対応のため, 既存の ISPACK と切り離す
- セクター計算は簡単に実装できる
- 現状
- FFT 部分はできている
- ルジャンドル変換はコード整理の段階
- MPI 並列は変換部分では対応しない. ユーザで層方向に MPI 並列することを想定している
- 開発の動機
次回日程
- 2014 年 6 月 10 日(火) 10:00 〜