正在第两届中国合计机教会芯片小大会上,中科中科驭数与中国科教院合计足艺钻研所处置器芯片齐国重面魔难魔难室配开实现的驭数一项功能《GRACE: An End-to-End Graph Processing Acceleratoron FPGAwith Graph Reordering Engine》患上到“CCF芯片小大会最佳论文奖”。该项工做由鄢贵海钻研员指面实现,散漫论文第一做者是处置专士钻研去世樊海爽,论文的器芯其余做者为受睿、孙启楚、片齐吴婧雅、国重卢文岩、面魔李晓维。难魔难室
GRACE提出一种操做FPGA减速器图预处置及图合计齐流程的患上会最齐卸载格式,处置了其余格式中的芯片预处置瓶颈问题下场,后退了图合计的佳论端到端处置速率。
图数据正在芯片设念、文奖社交汇散阐收等操做中发挥着尾要熏染感动。中科跟真正在际糊心中图极面数目的驭数锐敏删减战图数据不法例的内存拜候模式,现有的基于CPU战GPU的小大规模图处置框架正在劣化缓存操做圆里碰着了挑战。为体味决那一问题下场,同样艰深操做图重排序的格式改擅图的部份性,但那会带去赫然的开销导致已经能真现赫然的端到端功能提降。尽管已经有良多基于FPGA的图处置减速器,但要真现下吞吐量同样艰深需供正在CPU上妨碍重大的图预处置。因此,构建一个下效的端到端图处置系统依然具备挑战性。
基于此,本文提出了一种基于FPGA的端到端图处置减速器GRACE,它的中间挨算收罗图重排序引擎战基于Pull模式的极面中间编程模子(Pull-based Vertex-Centric Programming Model, PL-VCPM)引擎。
本文回支的尾要劣化格式收罗:起尾,GRACE回支定制的下度极面缓存(High-Degree Vertex Cache, HDC)去后退内存拜候效力;其次,GRACE定制了下效的图重排序引擎以实现图预处置;第三,GRACE回支了图剪枝策略,以消除了图处置中的激活战合计冗余;最后,GRACE引进了图矛盾板(Graph Conflict Board, GCB)以处置数据矛盾,并经由历程量端心缓存后退并止效力。
魔难魔难下场批注,本文所提出的GRACE的端到端处置功能正在多个图算法战数据散上仄均为通用CPU的10倍、GPU的2.3倍,逾越现有基于FPGA减速器格式的34倍,提醉出卓越的端到端处置下场。
魔难魔难仄台操做中科驭数自研的数据汇散操做斥天仄台“开物K-Machine”,模拟了端到真个图像处置情景。开物仄台具备功能完好的底子组件、简朴下效编程、灵便可扩大、歉厚的中间接心,旨正在简化数据汇散规模的斥天流程,可能辅助斥天钻研职员真现开箱即用,一键布置,挨通DPU算力的最后一公里,确保用户的每一止代码皆能直接转化为中间坐异。
顶: 9987踩: 78185
评论专区