LINPACK算法及其测试方法改进(完整版)doc资料_第1页
LINPACK算法及其测试方法改进(完整版)doc资料_第2页
LINPACK算法及其测试方法改进(完整版)doc资料_第3页
LINPACK算法及其测试方法改进(完整版)doc资料_第4页
LINPACK算法及其测试方法改进(完整版)doc资料_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

LINPACK其测试方改进(完整版)资料—ISSN1007ENGINEERING&SCIENCEA1No.A1,2021文章编号:—130X(2021A104LINPACKthe法及其试方法ofIts改进’。乃stMethod司照凯。濮晨SlZhao-kai江南技研究所江苏无锡214083(JiangnanofTechnology.Wuxi214083,China摘要:HPL(High是一种用来测试点性能的基测试序,过求解稠密线性组来评估的浮点性能。本文分析了HPL核心,HPL的时统进改进,出了一新的于时系统的试方法,达快速成LINPACK测的目的实验证明这新的测方法很效。thatnewwayhelpful.关键词:高性能;LINPACK;BLAS;MPl;L,UKeywords:highperformanceLINPACK;BLAS;M[Pl;LU:TP309:A1LINPACK。矩阵模以100×N×N种[“,析High属于N一。HPL八Petitet,RCWhaley,J.Dongarra和ACleary开发,通过解一稠密线方组(RandomDenseEquationsLIN-PACK本使用1.0a,2004发版。2HPLHPL过求一个稠密方组‘2|,如(1式示:Ax=b其,A=(粕N×N且为非b=(=(x1,毪,与b均为已知,待N维列向量。求解1间,且利(2式速:R:2N/3鬲-I-一』HPL式22N3/3+3N272模T执时间得到速率R后,峰值RpDuc相除就台效率呀。HPL求1式时,对阵A解(LUFactorization,到个上三矩个三阵L,且A等于这个矩阵乘积以方便,QRCholesky,HPLIUHPLLULULUFaetoriza—tion、LULUFactorization,它之区别主体在LU及尾矩阵更新执行顺不同HPIIU块,数据块映射到处理器网格,达到均衡载大为NBX列块成panelHPL・收稿日:2021-04-13;订日:—Address:JiangnanInstituteTechnology,Wu214083,P.R32时候先对panel内数据行然后对尾阵更新,update操得到L矩阵U矩,再并且计算差panel内数进行LU通PanelFactorization(PFACT‘RecursivePanel作完成[4],PFACTFACT均RightlookingLUFactorizationLeft-lookingLULUFactorization在后验发,些参数对LINPACK性能影响不HPL需要PassingSubroutines(131,AS者VectorSignalImageProcessingLibrary(VSIPL配合MPI主来处通BLASVSIPLUJ提各阵或者向运算数3LINPACK测试HPL,HPL,LINPACKHPLI括和存储系统构、访存速、处计算机系统连网络等,些会器Ⅱ指BLAS常用LAMMPIMPICH和OpenMPI,些针些殊构(如SNIP化BLAS也TunedLinearAlgebra—ware(ATLASGotoBLASEngineeringLibrary(ESSL、IntelLibrary(MKL和AMDMathLibrary中ESSLMKL和ACMLIBMAMD开发,自处支持选择哪考计机类型,过验[3]编译器择也关系文析了两本gee编译器对ⅢHPLHPL“HPL.dat”,P×QN和心(PXQ处理网列,N矩规,矩阵分,时不调整由于一,我试时要调整以及HPL。为了提测试速,种有测试方,献[5]分了几加快测方。献[根据各,为A类和B类。A包括、N和B类。A类,B类所测时候找最佳Q,定最N,后NB,A定再确定B类。献[6]定义矩阵算时量之效因子程度上关于矩阵而阵规模本身微乎一规通扫描规模运算效,来模并测试分块小NB,缩短测时间上面种试法但们只IAN-PACK浮点速率为唯一评判基准。忽略节,通信间,阵运算间等等。为更好测试,要提取更为丰富息。提出一种新基于时系统试方法原有计时系统改,取加丰富关键时间。通过计时可以快速定位佳试平台软硬配HPL以到快完成测试目。4HPL从2式可出,HPL时间THPL短,点THPL深入并且从找率因素。,cache[7]:=++P(3-(3TITc,a,TGLevel3BLASGEMMTL^2N31k=+(5BIAScacheNBP×Q法,较优络P×Q法等本提出基计系统试方法正基于论过计系统尽快确性关键因素HPL身已经提供了套计统对633了统计,有自己对6问计息HPI,会提然只到6但法好同各项值差’别RPFACT:panelLU解总HI’I._TIMING_PFACT:PFACT,MXSWP:LUpanelHPL_TIMING(updateHPI._TIMING_IASWP:updateHPL_TIMING_PTRSV:,P×Q,、网络和样,比重差异;其次HPLUPDATEupdate,update也生以能准确Tt;咖为r使好和hk应.们HPI?了修改,了以便于测试为和TBCASr・枷我们改L:I主updateGEMM组成,PFACT和RPFACT中GEMM,比重il/d,,可以略TⅨ脚l由两部组成部panelLUupdate部update为此,们增了HPL_TIMING_BCAST:GEMM:pdateHPIT(jTIMINGBcASTHPIHPI,1N=20000、N=16000N=10000,它置不变,总位“秒”后得加上微34N郁:蓼手茹雾勰差5LINPACK深入特性并很好指导部述般,两理器SMP服务器种第总两种接下来些,述,IJNPACK::HPlTIMINGHPLTIMING1,ASWP:BI,AS,BI.ASNB、N、NB情况F,最佳BI,AS库.HPI—GEMM反BI,AS优劣i:MPIP×QHPI ̄Ⅱt-K:汀HPL_TWaNG_LVP.P×Q:NNB、DEPTH以及其他就IlNPACK,际根情况会稍有变化面将x86务台上平台括两所台表2:表台Proces!;0r2×Intd(RXeon(TMCPU1Cache8KBD娥Level2Cache512陆3-8GBf,11×qn.rTfI,INIK在我们F,I.[NI’AK步骤下所“;第步:确定InAS十Ⅻ试骨足月垃井处器2I_IJ埔廿业4山Ⅻ昕H群。1q啪数据N]∞oP×q1×1NB值帆别使ATI(;otoBIAs洲试!i皆墅iE=三并在NB十和。蛞点浮建幸一m终使饰toBl,AS,第二:确定P×QjⅡ21{9300.P×Q—lxNB…““o…W……2∞‰№.P×QRE.pxQ1×2PXQ=z×1^mPXQI×2,TⅡ^NBH3NB“1×2horiiiiiiin———————!:!!=!‰、H3JL十NBⅢ∞LINPACK&^#5j—TIMINGGEMMHPI,TIMINGH:^盯和的值。在圉川P×Q2×】时HPLTIMING}jcAST=o为panel解之后需要广播。从例可“出1×2时的tlPI.TIMINGⅫ—TIM]NGlASWP和P×Q=2×时的—异{从固Ⅲ“出PXQ=1×2时的。FIMIN(;GEMMQ2×1时HPLTIMIGEMM异也不。在N一的拐处}I一一TIMINGGEMM很大这说%主要自BIAS,{2__=10]——41b!!]]!4fⅫcAsr∞Ⅲ:“L———————————{80l---------------------———-,,---i_i—r]—_ilr70L—!L—:H5{P×Q∥值第i步确定MPI袁_l中数据分别选用、MPICH和LAMMPI行验从“性尤其NB值比较小时所H终确定使用—玉互j四盟也L卫咝』LTIMINGBCAST(#(kMPICHI.A:Vf1{45182l91z119917141885L{121770I59L26010BLL;84L7507016311774NB2401314720941715zO25614671951210436873174390z8313039—L———NNB,。通多趺宴,示.点速率————墨L丑土垫量鲍曼蓝墨—T/VNNBP×0Gflops92001201x2860191282R81121×2&17BWR0{X2R81×2445文借助这转函数解浮点向VHDL准位std—logic转在具体实现时首先分别将有效数字小数点后的有效数位数转—logici,logicvector‘l,,,4nANSI、嵌套case-switch生通信口率很高分方法目适于特类list,通本文了合模,研究了法论研究了之虑模型具项目组正于重构操系统平研工作.模具体究和关键技被该平台降低合系统计期和提系统率方面起极促作参考文献:De,MicheliSystemHigh-levelSynthe—of25thACM/IEEEDesignAutomationConf,1988:483-488.[2]HallbergJ,Peng乙LocalTiming—straintsinHigh-LevelSynthesisProcofIEEEEUR(MICRO’95,1995:150TrandommionalPatti—噼xIEEProceedingsComlmltersand145Na3,May181[4]SaulJProgrammingResearchGroup.Hardware/SoftwareCodesignFPGA-BasedSyoftheonSy。3040-3046.Sankaran,Dr.RogerLHaggard.AConvenientMethodologyforEfficientTranslationofCtOVHDL上接第这样完了处器系统的LINPACK测试,浮点率为:刁:彳8.r608刁币一这个验处器有置式只有两种,播式能够选择的配置方少,存在跨越网卡的通信。所的这些都限制了计时系统作用的发使得某些数不够直观甚一功能得不到表现。比如计时系统可用于选择广播算法;当理器数目较多的时候,系对PXQ确定会有好的指导作用;计时系统在确定互连网结的时候也很用途。所以大群系中计时系统有着大的潜力。6束语本文通过对计系进行提出一种于计时系统的IJNPACK测试方法这种测试方法可以取细的时间参更好地引速试文分析这种试法一步且一个试台进了实。于试台局性,计时统优没完展。是体这测方还非有效。:Mingwang,XuJJan,CheZhenghua.HPIBenchmarkAnalyofaHighPerformancePCCIuster.ApplicationResearchofComputers,2004,V0121(9:P183187.肖旺。坚,永刚,华一个实高性PC集Ijnpack测试分计算应研究2004,V0121(9:P183-187.[3]LuoGuangwenWeimin.AnalysisofLinPackTeStParallelClusteronNumericalMethodsand—Applications2003APortableImplementationofHigh-PerformanceLinpackenchmarkforDistriburedat://。Jan20,2004.Guolin.TheFastLinpackTest—onIBMl350ClusterSyTechnologyand—68.[6]ZhangMingyuEmulationForecastofTestofRe—searchandDevelopment,2020,v0143(3:P557—562.张力,明宇,建平.HPI测性能仿真与预测计算研究与展2020V0143(3:P557562.1

六铬的测试方法六铬测试方法选测试方ISO3613USEPA3060A法沸水NaOH/NaCO萃方沸水35mins90-95℃法5mins))

NaOH/Na2390-95℃

点试沸水5mins)适用

金属镀层金属镀

泥土、塑料塑料、电电子零件零

金属镀层样品

2

2

5g

2备注有点镀层请务必提供:电镀层的重量和表面2

金属镀层测试方法金属层的测试方法一般ISO3613GB9791-2003沸水测试方法,方法步骤如下图所示:3

塑料电零件试价铬测试流程图适量的样品

二苯卡巴肼

煮沸腾l去离子水

溶解l+10l

、电子产品的一般采USEPA3060A液消其测试方法如下图所示

二卡巴肼

消2冷却过滤至100ml100ml

50ml取滴加硫节PH至左右40

820218otrieneVol.o.8A.:2021-11-01

:2021-04-13

(12B,YZX177

,-mil:50974936@q;;

t

1(

ts,题提出ts该以Ots中类间作度函,以阈当,以阈值更度作当速度,最值作惯权,动态搜索类间最阈:该Ots当间,ts,惯权值中类

TP391.41

AOtsuImageSegmttioMetBsedonIprovdPOAloritmLISe-xio1WANX-chuCHANGo-wen(SolfInfrmtinEngiri,HngcieceadTecholoyollg,hegzoChina1(ItittflctroicTcholoyteLAInfortingierinUivrityZhegzoChiaAstrctTheOtsuimaeementatioalgorithmasadtilityutoitsnns-idepndtcharcteristisHwver,itsortcmigslikelrgeonofcutinndorreltimeqaliyhavliieditplitionToslvetisprblweprposdanwsetatinalgrithsithepriiloftsnirvdPSOlorithm.kigtelsstwenvarincftsthefinssfntinofPSOtecrrenemtatitreslasthe

particescrrenlcatithuatiedftroldtherticle'srrenspeed,andusitirovetfrticles

bstfinesvleastheiriawigtofStropoedlgoritrceforthethr-sholdwhichmakstmaxiumvlfthecls-btweevariigrespacedynaiallyTeexrimtalreultsswthattnwalgoricanetgmentatioresultwhichisqaltthclassicO,sinificnlyrdsthtimfsgmnatinprssdalshaierefficiecy.KywrImgemntinO,Partilsrtiizai,IrtiwitFinesvl1

[1],;,P-til(tsu,OtsuOtsu,得,布模型无,对都较好,因此得广[2],,tsu,Otsu,,2Ost,t,t:L,集·392·G={0,1,2,L-1},i(i∈Gi总N:N=∑=0ni式中,iPi:Pi=iN(2Pi≥0,∑L-1ii=1t,,t0,;tL-1。则:类现概率ω0和:ω0=∑-1ii,∑miiPiω0现率和:ω1=LiPi,μi=∑L-1iiPiω1μT:μT=∑L-1i=0iiCCσ2:σ2=μ0μT2+ω1(μ1-μT2(6(3-(6一推σ2=ω0μ0-1以上各知,σ2t,tσ2σ2,(L2,

O

rilwartiizatinOKdyrhart1995“-”,,决,目义[3]设N,D维i≤i≤N可xii1,i2,xDviivi2,,vD,经记Pbesti=(pbesti1,besti2,,pbsiD所经记Gt=(gest1,gbest2,,gbetDPbstGbst,:vid(k+1=ω×vid(k+c1×rbtidi]+c2[pbeid-xid(k](8xi=xid(k+vi(9,viid(1≤d≤Dxididk,ω,c1,,2,r1,r3.2

3;,;(3ωω,ωPBjai[4],Zha指函Prk融合递减

[6],Li正递减[7]本应该与最适,,,,:+1=0.9,if

tdfort>0(t+1=fitness(t-fits(tiffiss(t>fis(t0,

elsetart-tartend*t/tma,

if=0for

msccssieietins,(t(tfine(tt,tart,endtta,M;,[-VVma]9,,,,,局部,若超指定,SO,,0,ω(;ω;ω,,·492·,另外,更过程相互独立迭代能拥因此次代过程可能另就达种,可常地避免陷入3.

基tOts图过程可就t,OtPOtsu,σ2POt更,,σ2::Ni(1≤i≤Nti255][-Vdax,Vx]vi,Wj(0≤j≤255Wjj=Wj/WμT=j*Wj(0≤j≤255:tPOi,ti,0~titi~255C1,∑Pj(0≤j≤ti-1,∑Pji≤j≤,μ0=j*Wj/ω0(0≤≤ti-1μ1=∑*W/i≤≤255σ2=ω1(μ0-μ12,if(ti=ω0μ0-μ12,ω0、、、ti来,更体Pst和局esti过有Peti所有经佳Get式、式更新ω由式(10调策决,Get,34

,OtsSts:20,100(10,start=0.end4,c1=cM=10,Vm=501

12310,ts,;StLena(sOts116256Pts117280.282511623ernOt1362569123PSts137250.136180.

tsO,PO,,ts,POOts,[1],.].,16(1:135-140[2],.Ot].,2021,28(4:1576-1579[3],,.[J].,2021,

2s[4]BajaiPSigSN.zzadtiprticlswarotiiztinforbidigstrteyiniformpriesptarke[J].IEETratisonwrsyst2020,[5]ZZi-hiZhangJLiY,etlAtivpariclewrtiizti[J].IETrstionystManyrtis2021,[6]PrkJngYLeeKY.Airoverticlesaropiizatifornoncnxcooicdispatcproblem].IETranatinonPowersystems2021,25(1[7]LiLi,XuBingNiuBetalTeolno-lieartrtyofiertiwihirtilswarmtiizti∥cisfthgroBi-IsiredCti.2021:1-5[8],.].:,2021,:532-537·592·于快速排序的改进算法::610000:(whlgdx下载时间:2021年月基于IGA的三维OTSU算的改进

066004

摘要OTSUOTSU、实时差。为此本文提出将免疫遗传应用到寻并采用递推方来减少适应函数。实验表明传统OTSU比晰实时得到明显改善。关键词;OTSU;疫遗传中图分类号:TP391ThresholdAlgorithmBasedTheImprovedofImmunityAlgorithmofandEngineering,YanshanAbstractOTSUmethodutilizescorrelationeachpixelinsegmentationithavebetterandtwo-dimensionalithadthehighcomplexcomputationalcomplexityandpoorreal-adoptedimmunityalgorithmandthesearchofoptimizingrepeatcomputationsoffitnessiniterationreducedsignificantlyusingrecursion.experimentalshowcomparedwiththetraditionalthresholdingsegmentationmethod,thethehadbeimproved.Keywords:imagesegmentation;three-dimensionalthresholdingsegmentationimmunityalgorithm[1][[1][[0引言实时性高成为应用最广泛众多法Otsu在年提出维最大类间方差法效果较好得到广泛应用但仅仅利用素身灰度信息没有利用素间空间信息并且信噪比较低遇到较复杂时容易产生较严重误针对这点我国学者刘健庄等在提出了自身灰度邻域平均灰度维Otsu法抗噪声力要强于并且果也有明显改善但着噪声加噪比不断低果也越来越差为景晓军等

[3]

引入了邻域

作为第特征造了三维直方并提出了三维Otsu使得于低信噪了更好效果并出了归法得三Otsu法杂度从

降到O(L3)九等

[4]

础正

但时有所少并且证了加了混噪声效果更好然递法入使三维Otsu法复杂度低了间仍长容易到噪声干此点提出将免遗传融入三维可利遗传固并行性、不易陷入局部优局搜特点在免疫融入遗传时也解了传退化现象服了遗法早熟收敛敛性缺大大提高了搜索效率总言免疫传应用三维Otsu高了法抗噪k/2kk/2k/2LLL1三维Otsu阈值分割法Mf

,y

x

g

,y

gy

1k2

fymn/2

(1)h

/2,

(2),k个所方上任意向j,kpp确ijkijkcijkijk其j,Lijk

pijk

ij

g

L

L

1

7

561

6

7134

14

2

L

1

h

L

h

L

1

(a)g

(b)g

L

L

q

3

ts024

2

77

5

11

6

1

6

L

3

4

4

h

h

L

(c)0、、

(d)、57Fig.1histogram

1(b)1(c)(d)邻邻常近而界近以异会显基以认别看看缘声边声远远小我将7有率近似,,,,iPjPkPijk,,,,iPjPkPijkijkijk三维直方图中的区域0分别代表图像的背景和目标,为了表示方便,将这两个区域分别表示C,则背景和目标分别出现的概率为:ijkkP,背景和目标对应的均值矢量分别为:

0i

0j

0

jPkPijkijkijkjk,jkP00

(6)1i

1j

1

iPjPkPijkijkijkj11

(7)三维直方图上总的均值矢量为:TTiTj

LLLLLLLLjkijkijk

(8):P0阵

S

B

P

1T0

(11)S有tSrBTi0jTkTi1j1k

iTijTjTk

[[6,7]

i

j,k

iPijk

j

j,kq

jPijk

k

j,k,

ijk

tSrrB2基于的维OTSU改进

(13)、适应评估选择和变异等易编码、作简全局解空搜索有待:易早熟、收敛性差等系统对界入菌、御其点作简单、收心苗接目前(Algorithm称I)存在合式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论