スケジュールはいくらですか

アルゴリズムの情報グラフ(TGA)の階層型並列形式(LPF)の再編成に関する計算実験の基本データは、以前の出版物に記載されています。現在の出版物の目的は、変換自体の計算の複雑さと結果のスケジュールの品質の観点から、並列プログラムを実行するためのスケジュールの開発に関する研究最終結果を示すことです。この作業は、検討中の領域で明確に定義された研究サイクルの結果です。





前述のように、この場合の計算の複雑さ(BT)は、YAPFを再編成するプロセスでの層から層へのオペレーターの移動の単位で計算されます。このアプローチは、数値配列の順序付け(ソート)操作のBTを決定するための従来の方法に近いものです。欠点は、順列の要素を決定するための手順の複雑さを考慮に入れていないことです。





なぜなら受け入れられているモデルでは、YAPFは実際に並列プログラムの演算子の実行順序を決定します(演算子は層のグループで1つずつ実行されます)。短縮のために、省略形「YAPF」を次のように使用することがあります。並列プログラムを実行するための計画(スケジュール)の概念の同義語。明らかな理由から、より大きなサイズのデータ​​を処理するときに得られた結果の正確さが維持されることを前提として、比較的少量のデータで研究が実施されました。この出版物に記載されている研究は、割り当てられたタスクを解決するために利用可能なツールの機能を実証することを目的としています。必要に応じて、Data-Flowモジュールでアルゴリズムを記述およびデバッグすることにより、任意のアルゴリズムを調査することができます。 その後、情報グラフの形式でSPF @ホームモジュールにインポートしてさらに処理します。





LPF変換の主な目標として、最大コード密度(実際には、並列コンピューティングシステムで使用可能な個々のコンピューターの最大負荷)を取得することを引き続き検討します。ちなみに、VLIWアーキテクチャコンピュータの非常に長いマシンワードの「バンドル」にあるNOP命令の数が多すぎるという、よく知られている邪悪な皮肉な声明が関連しているのは、まさにこれらの概念です。完全にシーケンシャルなコードのセクションがあります。非常に長い単語のギャップは、正式には何らかの操作で埋める必要があります-「ダミー」)..。





以前と同様に、Lua言語で実装され、YPFの変換を制御する、開発されたヒューリスティックメソッド(単にヒューリスティックと呼ばれることもあります)を参照し  ます。また、電卓の並列フィールドで複数のプロセスのコマンドを同時に実行する可能性も考慮していません(ただし、理論的には、これによりコード密度が増加する可能性があります)。





引用された研究では、オペレーターの層(通常は汎用レジスター)間でデータを一時的に保存するための実際のメモリ量の制限が考慮されていませんでした。この制限により、取得したソリューション(および宣言された目的でのRAMの使用)が悪化する可能性があります。 -パフォーマンスを低下させるため)。一方、シミュレーションでは、レジスタファイルの妥当なサイズを見積もることができます。   





    . ,   , .2 SPF@home (http://vbakanov.ru/spf@home/content/install_spf.exe). – , {k,l} ( ) ik,jk il,jl, i,j – ( , ; ).





(, ) , – .





( ) (, ) –   “1-01_bulldozer” vs “1-02_bulldozer”, - “WidthByWidtn” vs “Dichotomy”. , …





1.

  () . ( ). ( ). .. , .





– “1-01_bulldozer” “1-02_bulldozer”.





. 1-3; ( ):





  • a), b) ) – , (CV ),  ( ) ;





  • (), () - () – , “1-01_bulldozer”   “1-02_bulldozer” c.





図1.2、3、5、7、10次の正方行列(横軸に沿った番号付けに対応)を古典的な方法で乗算するアルゴリズムのLPFの高さを維持したままの並列実行プランのパラメーター
1. 2,3,5,7,10- ( )
図2.ペア相関係数を5,10,15,20ポイント計算するアルゴリズムのLPFの高さを維持しながら、並列実行の計画のパラメーター(横軸に沿った番号付けに対応)
2. 5,10,15,20- ( )
 3.         
       ()   
2,3,4,5,7,10-  (     )  
()
3. () 2,3,4,5,7,10- ( ) ()

. 1-3 , . ., . 1a) 1,7 ( “1-01_bulldozer”) 3 ( “1-02_bulldozer”) 10- .





(. 1b) 0,3 ( ) “1-02_bulldozer” , , .





(. 1c) “1-02_bulldozer” ( 3,7 10) “1-01_bulldozer”.





, .





  “1-02_bulldozer” (. 2).





() 10 (. 3) . (. 3a), CV (. 3b), “1-02_bulldozer” (. 3c).





 , , (   ) . .. , ( ).





2.

VLIW- ( “”, “” ). .





  W ( W=W0 W=1, W0 – , ). – “Dichotomy” “WidthByWidtn”:





  • “Dichotomy”. – c W c    . W, ,   W. , “” ( ).





  • “WidthByWidtn”. N>W   , :





  ,  .





. 4,5  -     () ; “WidthByWidtn” “Dichotomy” . ,   “” .





 4.   ()     (), 
;        
 5  10-  – . a)  b)
4. () (), ; 5 10- – . a) b)
 5.   ()     (), 
;         ()   5  10-  – 
. a)  b)
5. () (), ; () 5 10- – . a) b)

. 4 5, ( , ,  !). , .





“ -” “WidthByWidtn” , “Dichotomy”; . “WidthByWidtn” , N./W. , N. – , W. – .





図6.古典的な方法(横軸)で10次の正方行列を乗算するアルゴリズムのFPの幅が減少した場合の、層間の演算子の移動数-a)と変動係数CV-b)軸はリフォーム後のFPの幅です)
6. - a) CV - b) 10- ( – )
図7.直接による10次の線形代数方程式のシステムを解くためのアルゴリズムのLPFの幅の減少に伴う層間の演算子の変位の数-a)および変動係数CV-b) (非反復)ガウス法(横軸はリフォーム後のLPFの幅)
7. - a) CV - b) 10- () ( – )

, . 6 7, ( , – ).   . 6 7,   “WidthByWidtn” ( 3-4 ) ( ) “Dichotomy” ( ). , () “WidthByWidtn” “Dichotomy” ( ).





.. () . .





, ( ) .





  ( ) .






:





  • (https://habr.com/ru/post/530078/, 26.11.2021)





  •   (https://habr.com/ru/post/534722/, 24.12.2021)





  • (https://habr.com/ru/post/535926/, 03.01.2021)





  • ストリーミングコンピューターダイナミクス(https://habr.com/ru/post/540122/、02/01/2021





  • 同時実行性とコード密度(https://habr.com/ru/post/545498/、03/05/2021





  • スケジュールは(どのくらいあるhttps://habr.com/ru/post/551688/ - 、2021年4月10日)現在








All Articles