Masterproef T802 : Data-distributie op parallelle computers
Begeleiding:
|
||||||||
Onderzoeksgroep:
Technisch Wetenschappelijk Rekenen en
Numerieke Approximatie en Lineaire Algebra Groep
|
||||||||
Context:
Wanneer de uitvoering van een programma teveel tijd kost of wanneer de data niet in het geheugen van de computer past, kan de uitvoering verspreid worden over meerdere computers, die tegelijkertijd aan het probleem werken, en dit zoveel mogelijk onafhankelijk van elkaar. Hierbij moet ook de corresponderende data over de computers verspreid worden. Deze stap, de data-distributie, gaat aan het eigenlijke parallelle werk vooraf, maar vaak is herdistributie nodig terwijl het parallelle rekenen aan de gang is. Parallellisme speelt tegenwoordig ook een belangrijke rol binnen één enkele processor, waarin steeds meer kernen (cores) gebundeld worden. Hoewel deze kernen data kunnen lezen en schrijven in het hele geheugen van de processor, is data-distributie vaak nuttig omwille van de hiërarchische structuur van het geheugen. Met hulp vanuit het Flanders ExaScience Life Lab zul je in dit project het probleem van datadistributie toepassen op generieke problemen, eerst op multicore architecturen, en later op een HPC cluster of supercomputer. |
||||||||
Doel:
Deze masterproef heeft tot doel parallelle data-distributies voor hypergrafen te ontwikkelen. Deze zullen worden toegepast in verscheidene toepassingsgebieden. De ontwikkelde distributiemethoden zullen worden geëvalueerd op verschillende architecturen en vergeleken met bestaande methodes. |
||||||||
Uitwerking:
Het doel van de data-distributie is om de vertices van de hypergrafe over de parallelle programma's te verdelen, zodanig dat de data toegewezen aan elke deeltaak zo veel mogelijk onafhankelijk is van de andere deeltaken. Immers, gedeelde afhankelijkheden vereist communicatie en synchronisatie. Deze communicatie- en synchronisatie-overhead moet geminimaliseerd worden. Tegelijkertijd willen we dat er maximaal gebruik gemaakt wordt van alle beschikbare cores, dus moet de data ook zodanig verdeeld worden dat elke deeltaak ongeveer evenveel werk heeft. Het is ook de bedoeling om rekening houden met de verschillende eisen van communicatie over een netwerk ten opzichte van de veel snellere communicatie tussen cores binnen een processor. Voor experimenten zal gebruik worden gemaakt van HPC clusters van het Flanders ExaScience Life Lab en van het Vlaams Supercomputer Centrum. |
||||||||
Relevante literatuur:
|
||||||||
Profiel:
Gemengd theoretisch en praktisch werk. Deze masterproef is voor 1 student. |