矩陣乘法課件_第1頁
矩陣乘法課件_第2頁
矩陣乘法課件_第3頁
矩陣乘法課件_第4頁
矩陣乘法課件_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、算法1: for (i=1;i=n;i+) for (j=1;j=n;j+) cij=0; for(k=1;k=n;k+) cij=cij + aik*bkj; T(n)=O(n3)S(n)=O(n2)1算法2: for (i=1;i=n;i+) par for(k=1,k=n;k+) cik=0; for (j=1;j=n;j+) par for(k=1;k=n;k+) cik=cik +aij *bjk ; T(n)=O(n2)S(n)=O(n2)P(n)=O(n)2for (i=1;i=n;i+) par for(k=1,k=n;k+) cik=0; for (j=1;j=n;j+) p

2、ar for(k=1;k=n;k+) cik=cik +aij *bjk ; 外循環 內循環 SIMD操作 k=1,2,n i j ci1=ci1+aijbj1 ci2=ci2+aijbj2 cin=cin+aijbjn 1 1 c11=c11+a11b11 c12=c12+a11b12 c1n=c1n+a11b1n 2 c11=c11+a12b21 c12=c12+a12b22 c1n=c1n+a12b2n . . n c11=c11+a1nbn1 c12=c12+a1nbn2 c1n=c1n+a1nbnn 局 存 PEM1 PEM2 PEMn3for (i=1;i=n;i+) par fo

3、r(k=1,k=n;k+) cik=0; for (j=1;j=n;j+) par for(k=1;k=n;k+) cik=cik +aij *bjk ; 外循環 內循環 SIMD操作 k=1,2,n i j ci1=ci1+aijbj1 ci2=ci2+aijbj2 cin=cin+aijbjn 2 1 c21=c21+a21b11 c22=c22+a21b12 c2n=c2n+a21b1n 2 c21=c21+a22b21 c22=c22+a22b22 c2n=c2n+a22b2n . . n c21=c21+a2nbn1 c22=c22+a2nbn2 c2n=c2n+a2nbnn 局 存

4、 PEM1 PEM2 PEMn4for (i=1;i=n;i+) par for(k=1,k=n;k+) cik=0; for (j=1;j=n;j+) par for(k=1;k=n;k+) cik=cik +aij *bjk ; 外循環 內循環 SIMD操作 k=1,2,n i j ci1=ci1+aijbj1 ci2=ci2+aijbj2 cin=cin+aijbjn n 1 cn1=cn1+an1b11 cn2=cn2+an1b12 cnn=cnn+an1b1n 2 cn1=cn1+an2b21 cn2=cn2+an2b22 cnn=cnn+an2b2n . . n cn1=cn1+a

5、nnbn1 cn2=cn2+annbn2 cnn=cnn+annbnn 局 存 PEM1 PEM2 PEMn5算法3: 采用n2個處理器,pij表示位于陣列第i行第j列的處理機. 以n=4為例。將初始分布變換為“1”分布,即每個pij 將aij向西(左)移到i-1個處理機中,將bij向北(上)移到j-1個處理機中,并將新的 aij *bi的結果加至 cij中。將“1”分布換為“2”分布,即每個pij 將aij向西移到相鄰的處理機中,將bij向北移到相鄰的處理機中,并將新的 aik *bkj的結果加至 cij中。將“2”分布換為“3”分布, 方法同(2)。將“3”分布換為“4”分布,方法同(2)

6、。6初始分布: a11b11 a12b12 a13b13 a14b14 a21b21 a22b22 a23b23 a24b24 a31b31 a32b32 a33b33 a34b34 a41b41 a42b42 a43b43 a44b44 “1”分布: a11b11 a12b22 a13b33 a14b44 a22b21 a23b32 a24b43 a21b14 a33b31 a34b42 a31b13 a32b24 a44b41 a41b12 a42b23 a43b34 7“3”分布: a13b31 a14b42 a11b13 a12b24 a24b41 a21b12 a22b23 a23b

7、34 a31b11 a32b22 a33b33 a34b44 a42b21 a43b32 a44b43 a41b14“4”分布: a14b41 a11b12 a12b23 a13b34 a21b11 a22b22 a23b33 a24b44 a32b21 a33b32 a34b43 a31b14 a43b31 a44b42 a41b13 a42b24 10“1”分布: a11b11 a12b22 a13b33 a14b44 a22b21 a23b32 a24b43 a21b14 a33b31 a34b42 a31b13 a32b24 a44b41 a41b12 a42b23 a43b34 “2”分布: a12b21 a13b32 a14b43 a11b14 a23b31 a24b42 a21b13 a22b24 a34b41 a31b12 a32b23 a33b34 a41b11 a42b22 a43b33 a44b44 “3”分布: a13b31 a14b42 a11b13 a12b24 a24b41 a21b12 a22b23 a23b34 a31b11 a32b22 a33b33 a34b44 a42b21 a43b32 a44b43 a41b1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論