0% found this document useful (0 votes)

68 views

Lesson2 5DistributedMemorySorting PDF

The document summarizes algorithms for distributed sorting, including bitonic sort, bucket sort, and sample sort. Bitonic sort uses a bitonic merge that has work of O(n log n) but is not work-optimal. Distributed bitonic sort can use either a block distribution scheme with O(log P) communication stages or a cyclic scheme with O(log(n/P)) computation stages. Sample sort uses sampling to choose splitters that define variable-sized buckets, allowing a linear time sort by distributing elements between processes in parallel.

Uploaded by

Projectlouis

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

68 views

Lesson2 5DistributedMemorySorting PDF

Uploaded by

Projectlouis

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 9

Lesson25DistributedMemorySorting

BitonicSort

Thepseudocodeforgeneratingabitonicsequence:

1. createtwobitonicsubsequences
2. Makeoneanincreasingsequence
3. Makeoneintoadecreasingsequence

2
Workforabitonicsort:W
(n)= (nlog
(n))thisalgorithmisnotworkoptimal
bs
2
Spanforabitonicsort:D
(n)= (log
(n))
bs

DistributedBitonicMergeviaBinaryExchange

Withregardstobitonicsorts,everythingboilsdowntodoingbitonicsortsefficiently.

Step1:abitonicsplit,performedinplace
Attheendofstage1therearetwobitonicsubsequences

Foradistributedalgorithm,dividetheprocessesbetweenthe
nodes.

Thisshowstheminimumbetweenthetwoinputs.(Thestartofthesplit.)

Thesecondredlineshowthemaximumbetweenthetwoinputs.Theedges
indicatethedependencebetweenthetwoinputsandoutputs.

Theendresultisabitonicsplit.

Thisshowstheinputs,theoutputs,andthepatternsof
dependencies.

Tolookatthedistributedversionofthethis:
Using4processingnodes.

Inthiscase,communication
Communicationoccursanywhereadependenceedgecrosses
aprocessboundary.
Binaryexchange=twoprocessesswappingdatawitheach
other.

Notethatallcommunicationoccursinthefirstlog(p)stages.

Thereareonlylog(p)stagesthatrequirecommunication.
Intheotherlog(n/P)stagesthereisnoneedforcommunicationbetweenprocesses.

Inacyclicdistributiontherowsofthenetworkareassignedtodifferentprocessesina
roundrobinfashion.Thecommunicationissimilartotheblockscheme.

PickaNetwork

Whichnetworkwouldallowforfullyconcurrentexchangeswithoutcongestion?
Hypercubeandfullyconnectedtopologies.
Thisisbecauseyouneedanetworkwithalinearorbetterbisectionwidth.Thefullyconnected
networkismorethannecessary.

CommunicationCostofaBitonicMerge

Whatisthecommunicationtimeofabitonicmerge,assumingablockdistributed,
binaryexchangeschemeonahypercube.

Communicationtime=(a+(b*(n/p))*log(p))
Recall,thebinaryexchangeschemeonlycommunicatesduringthefirstlog(P)stages.
Eachprocesshastosendn/Pwordsateachstage.

BitonicMergeviaTransposes

Twodistributedbitonicmergeschemeshavebeendiscussed:

Blockdistributionscheme:log(P)stagesofcommunication
andlog(n/P)stagesofcomputation.

Cyclicscheme:log(n/P)stagesofcomputationandlog(P)stages
ofcomputation

Therunningtimeforthetwoarethesame:T
(nP)= log(P)+ (n/P)log(P)
net

Istheresomethingthatwillreducethe term,evenatthecostofincreasingthe term?YES

Startwithacyclictopology:
Thismeansthereisnocommunicationinitially.Thenswitchtoblock,whichmeansno
communicationattheend.Tomakethisworkthedatawillhavetobetransposed(or
shuffled).

Thetransposecanbeseenasanalltoallexchangeorasa
matrixtranspose.

2
Ifwelookatoneprocessnote:itneedstosendP1messages,eachofsizen/P
,toalltheother
processes.

Todeterminetheprocesstime:
1. Assumethenetworkisfullyconnected.

T
(nP)= (P1)+ (n/P)((P1)/P)Fullyconnectednetwork.
trans

Thereisalatencybandwidthtradeoffbetweenthetwo
schemes.
Inpracticeisitveryhardtofortheblockorcyclicschemeto
beatthetransposescheme.

ButterflyTrivia
Nameanotherfamousalgorithmthatfollowsthesame
computationalpattern.
FastFourierTransform

BitonicSortCostComputation

= cost/compare

(n/P )K = totaltimetodothecomparisons,atmergingstageK

Therearelognmergingstages,sothetotalcostforcomputationis:

BitonicSortCostCommunication

Assume:n,ParepowersofnP/n

T
(m)= + m
msg

Whatisthecommunicationtime?
Thekeyquestion:wheredoes
communicationhappen?
ForeachstageK,thesizeofthe
K
bitonicmergeisn
=2
K

Stage4asinglebitonicmergeof
size16.

AssumeablockdistributionwithPprocesses.
CommunicationonlystartswhenK>log(n/P)

Klog(n/P)
P
=2
whenk==log(n)itissimplifiedtoP
K

BitonicMergeinPprocessesofnsizerequires

Timetocommunicate

Sothetimefortheentiresortis:

Thesimplifiedversionis:
O( log(P ) + (n/P )(log 2

P))

LinearTimeDistributedSort,Part1

Anycomparisonbasedalgorithmforsortingscalesto:O(nlogn)

ForthebucketsortO(n)

Todobucketsort:
1. Startbyassumingyouknowthepossiblevalues.R={0,1,2,3,...,m1}
2. Thevaluestobesortedareuniformlydistributedovertherange.
3. DivideRintokbuckets

4. Thebucketsortfirstfiguresoutwhichbucketeachvaluebelongs.

5. Sortwithinineachbucketandconcatenatetheresults.

Howisthisalineartimescheme?
Howmanyelementsareineachbucket?theexpectednumberofelementsineachbucketwill
ben/k.(Assumetheelementsareevenlydistributedacrosstherange)

Thetimetosorteachbucketis:O(n/klog(n/k))

DistributedBucketSort
Itistodistributeassigneachbuckettoacomputenode.
Makethefollowingassumptions:
k=P
elementspernode~n/Pelementspertable
Assumeallnodesknowbucketranges
Assumethenetworkisfullyconnected

Therunningtimeis:O(b*(n/P)+t*(n/P)+(a*P))
Thestepstogetthis:
1. Eachprocessneedstoscanitslistoflocalelementsanddecidewhichelementsgo
where.Thenodescandothisinparallelandtheworkislinear.
2. Thenodesneedtoexchangeelements(analltoalloperation).Eachnodehas~n/P
2
elements.Soexpecttosendn/P
elementstoeverynode.Assumethenetworkisfully
connected.
3. Noweachbucketmustdoalocalsort,ofcostO(n/P)

LineartimeDistributedSort,Part2:SampleSort

Thebucketsorthasamajorflawtheassumptionofauniformdistributionofvaluesacross
thebuckets.Ifyoudonothaveuniformdist.,youwillnotgetanequalnumberofelementsin
eachbucket.

SouseSampling.
Dobucketsort,buttheintervalsvaryaccordingtothedata.Todecidethesizeoftheintervals,
usesampling.

TodoSampleSort:
1. Beginwithdataand,inthiscase,3processes.

2. Assumetheelementsareequallydist.amongthe3processes:

3. Sortthemlocally

4. Eachprocesswillchooseasampleofelementsfromtheirlist.Eachshouldchoosethe
sameequallyspacedelements.

5. Gatherthesamplesintheroot.
6. Sortthesamplesontheroot.

7. SelectP1splitters(inthiscase2)

8. Thesplittersdefinetheglobalbucketboundaries.
9. Forthisexample:

Thefirstbucketwillgetthefirstsplit,the0elements.Thesecondbucket
willgetthesecondsplit,13.Thethirdbucketwillgetthelastsplit,4end.

10. Nowthesplitterswillneedtobebroadcast.
11. Eachnodecanpartitionitselementsusingthesplitters.

12. Thenthenodesexchangevalues.Eachnodewillgetonlythevaluesinitsrange.
13. Theneachnodewilldoalocalsort.

Intherunningtimeforthissamplesort,whatisthelargestasymptoticfunctionofP?(AssumeP
processes)

2
2
2
O(P
)orO(P
logP)...TheroothastosortP
samples.

Ifthesystemistrulymassive,thiscouldbeadelimitedtoscalability.

Anderson, Modern Compressible Flow Solution
18% (45)
Anderson, Modern Compressible Flow Solution
135 pages
Linear Programming On Work Scheduling - Operations Management
100% (1)
Linear Programming On Work Scheduling - Operations Management
3 pages
Flightno. 201 202 203 203: 5.6. Traveling Salesman Problem
No ratings yet
Flightno. 201 202 203 203: 5.6. Traveling Salesman Problem
7 pages
HPC Final PPTs
No ratings yet
HPC Final PPTs
369 pages
chap9_slides
No ratings yet
chap9_slides
68 pages
Lect8 Parallel System
No ratings yet
Lect8 Parallel System
43 pages
9-Biotonic sort
No ratings yet
9-Biotonic sort
25 pages
Bi Tonic Sort
No ratings yet
Bi Tonic Sort
20 pages
Bitonic Sort
No ratings yet
Bitonic Sort
23 pages
(Slideshare Downloader La) 63c8d73f6879b
No ratings yet
(Slideshare Downloader La) 63c8d73f6879b
31 pages
Sorting Bitonic Sort
No ratings yet
Sorting Bitonic Sort
7 pages
Parallel Algorithms
No ratings yet
Parallel Algorithms
48 pages
Bitonic Sort (Quang)
No ratings yet
Bitonic Sort (Quang)
11 pages
Bitonic Sort
No ratings yet
Bitonic Sort
2 pages
Bitonic Sort
No ratings yet
Bitonic Sort
3 pages
Parallel Algorithm Lecture Notes
No ratings yet
Parallel Algorithm Lecture Notes
28 pages
10 Sorting
No ratings yet
10 Sorting
20 pages
Csed 605 WK 10
No ratings yet
Csed 605 WK 10
39 pages
MCS-208 - Google Docs
No ratings yet
MCS-208 - Google Docs
8 pages
MergeSort Key Points
No ratings yet
MergeSort Key Points
22 pages
Advance Computer Architecture
No ratings yet
Advance Computer Architecture
16 pages
Implementing Bubble Sort Algorithm
No ratings yet
Implementing Bubble Sort Algorithm
6 pages
3.parallel Processing - Algorithms
No ratings yet
3.parallel Processing - Algorithms
37 pages
Sorting: - Review of Sorting - Merge Sort - Sets
No ratings yet
Sorting: - Review of Sorting - Merge Sort - Sets
31 pages
Sorting 2
No ratings yet
Sorting 2
26 pages
PUT_Sol
No ratings yet
PUT_Sol
40 pages
Introduction To Computer Science I Harvard College
No ratings yet
Introduction To Computer Science I Harvard College
28 pages
CS502 Midterm Study Guide
No ratings yet
CS502 Midterm Study Guide
3 pages
CSCE 3110 Data Structures & Algorithm Analysis: Rada Mihalcea Sorting (II) Reading: Chap.7, Weiss
No ratings yet
CSCE 3110 Data Structures & Algorithm Analysis: Rada Mihalcea Sorting (II) Reading: Chap.7, Weiss
26 pages
Presentation: Bitonic Sort: Presented By: Eng Zahir Ullah
No ratings yet
Presentation: Bitonic Sort: Presented By: Eng Zahir Ullah
11 pages
Lecture18
No ratings yet
Lecture18
2 pages
Algorithmica: Sorting-Based Selection Algorithms For Hypercubic Networks
No ratings yet
Algorithmica: Sorting-Based Selection Algorithms For Hypercubic Networks
18 pages
Chapter 10: Algorithms 10.1. Deterministic and Non-Deterministic Algorithm
No ratings yet
Chapter 10: Algorithms 10.1. Deterministic and Non-Deterministic Algorithm
5 pages
1 Counting Sort
No ratings yet
1 Counting Sort
8 pages
Data Structures & Algorithm Analysis
No ratings yet
Data Structures & Algorithm Analysis
26 pages
Fundamental Computing Algorithms
No ratings yet
Fundamental Computing Algorithms
58 pages
Parallel and Distributed lec 11
No ratings yet
Parallel and Distributed lec 11
15 pages
36_BigO_Sort
No ratings yet
36_BigO_Sort
17 pages
HW4: Merge Sort: 1 Assignment Goal
No ratings yet
HW4: Merge Sort: 1 Assignment Goal
6 pages
CH -3 DPC
No ratings yet
CH -3 DPC
6 pages
CPSC Algorithms Cheat Sheet
No ratings yet
CPSC Algorithms Cheat Sheet
6 pages
Online Instructions For Chapter 2: Divide-And-Conquer: Algorithms Analysis and Design (CO3031)
No ratings yet
Online Instructions For Chapter 2: Divide-And-Conquer: Algorithms Analysis and Design (CO3031)
16 pages
24 Notes
No ratings yet
24 Notes
12 pages
Algorithm-Lecture4 - Sorting-1
No ratings yet
Algorithm-Lecture4 - Sorting-1
45 pages
Lecture 7
No ratings yet
Lecture 7
40 pages
Merge Sorting
No ratings yet
Merge Sorting
8 pages
Search_Sorting_Algorithms_Study_Notes
No ratings yet
Search_Sorting_Algorithms_Study_Notes
3 pages
Data Structure 1
No ratings yet
Data Structure 1
22 pages
Sorting
No ratings yet
Sorting
32 pages
Merge Sort Seminar
No ratings yet
Merge Sort Seminar
22 pages
Cours 3
No ratings yet
Cours 3
54 pages
DATA STRUCTURES AND ABSTRACT DATASTRUCTURE (1)
No ratings yet
DATA STRUCTURES AND ABSTRACT DATASTRUCTURE (1)
18 pages
CCC121-07-Sorting Algorithms
No ratings yet
CCC121-07-Sorting Algorithms
15 pages
Course Objectives: CO1 CO2
No ratings yet
Course Objectives: CO1 CO2
10 pages
Sequence Algorithms Screen
No ratings yet
Sequence Algorithms Screen
13 pages
509907.509993
No ratings yet
509907.509993
7 pages
Sorting
No ratings yet
Sorting
2 pages
Foundatios of Data Structures by E. Hari, Assistant Professor Dept. of Computer Science and Engineering
No ratings yet
Foundatios of Data Structures by E. Hari, Assistant Professor Dept. of Computer Science and Engineering
133 pages
cs3353-cdsunit-v
No ratings yet
cs3353-cdsunit-v
6 pages
Sorting: Gordon College
No ratings yet
Sorting: Gordon College
98 pages
Pram Algorithms: Merging and Graph Coloring
No ratings yet
Pram Algorithms: Merging and Graph Coloring
4 pages
Sorting Algorithms
No ratings yet
Sorting Algorithms
10 pages
Some Case Studies on Signal, Audio and Image Processing Using Matlab
From Everand
Some Case Studies on Signal, Audio and Image Processing Using Matlab
Dr. Hedaya Mahmood Alasooly
No ratings yet
Lesson2 6DistributedBFS PDF
No ratings yet
Lesson2 6DistributedBFS PDF
6 pages
Lesson 3 4 Cache Oblivious Algorithms: The Ideal Cache Model
No ratings yet
Lesson 3 4 Cache Oblivious Algorithms: The Ideal Cache Model
4 pages
Lesson2 7GraphPartitioning PDF
No ratings yet
Lesson2 7GraphPartitioning PDF
14 pages
Lesson1-7 Parallel Pointers Graphs PDF
No ratings yet
Lesson1-7 Parallel Pointers Graphs PDF
7 pages
Lesson3 3IOAvoidingAlgorithms PDF
No ratings yet
Lesson3 3IOAvoidingAlgorithms PDF
8 pages
Lesson1-1 Introduction PDF
No ratings yet
Lesson1-1 Introduction PDF
8 pages
Lesson2 4DistributedMartrixMultiply PDF
No ratings yet
Lesson2 4DistributedMartrixMultiply PDF
7 pages
Lesson1-5 5 PDF
No ratings yet
Lesson1-5 5 PDF
7 pages
Lesson1 5TreeComputations PDF
No ratings yet
Lesson1 5TreeComputations PDF
17 pages
Deep Learning Unit 1..
No ratings yet
Deep Learning Unit 1..
21 pages
Knighttour 110904035548 Phpapp01
No ratings yet
Knighttour 110904035548 Phpapp01
22 pages
Roots of Equations Case Studies
No ratings yet
Roots of Equations Case Studies
16 pages
DSP Lecture Plan
No ratings yet
DSP Lecture Plan
5 pages
The Dual Simplex Algorithm Operation Research: Prepared by RITU MALIK
No ratings yet
The Dual Simplex Algorithm Operation Research: Prepared by RITU MALIK
11 pages
ADALINE
No ratings yet
ADALINE
3 pages
Lab 4
No ratings yet
Lab 4
3 pages
CSP+'24-25+Unit+10+-+Algorithms
No ratings yet
CSP+'24-25+Unit+10+-+Algorithms
107 pages
18ai61-Model Question Paper Solutions
No ratings yet
18ai61-Model Question Paper Solutions
71 pages
Decision Tree Classification Algorithm
No ratings yet
Decision Tree Classification Algorithm
4 pages
Assignment Problem: A. R. Dani
No ratings yet
Assignment Problem: A. R. Dani
58 pages
Chandy-Misra-Haas Algorithm For The AND & OR Mmodel - 1606285821
No ratings yet
Chandy-Misra-Haas Algorithm For The AND & OR Mmodel - 1606285821
3 pages
Unit 5 - 1 LBC
No ratings yet
Unit 5 - 1 LBC
46 pages
1967, Joyal, A., Labelle, G. and Rehman, Q. I., On The Location of Zeros of Polynomials
No ratings yet
1967, Joyal, A., Labelle, G. and Rehman, Q. I., On The Location of Zeros of Polynomials
11 pages
More Challenging Problems On Numerical Analysis
No ratings yet
More Challenging Problems On Numerical Analysis
14 pages
Non-Linear Systematic Turbo Codes Over GF (4) : D. M. Petruzzi, M. C. Liberatori, J. C. Bonadero and J. Castiñeira Moreira
No ratings yet
Non-Linear Systematic Turbo Codes Over GF (4) : D. M. Petruzzi, M. C. Liberatori, J. C. Bonadero and J. Castiñeira Moreira
6 pages
Gaussian Elimination Method
No ratings yet
Gaussian Elimination Method
2 pages
Lecture 6: Linear Systems and Convolution: Ee-2027 Sas, L6 1/18
No ratings yet
Lecture 6: Linear Systems and Convolution: Ee-2027 Sas, L6 1/18
18 pages
Metaheuristic Algorithms For 6G Wireless Communications Recent Advances
No ratings yet
Metaheuristic Algorithms For 6G Wireless Communications Recent Advances
35 pages
Activity 1.1.3 Peacekeeping Problem: Finding The Objective Function
No ratings yet
Activity 1.1.3 Peacekeeping Problem: Finding The Objective Function
6 pages
Information Theory Coding And Cryptography 3rd Edition Ranjan Bose all chapter instant download
100% (1)
Information Theory Coding And Cryptography 3rd Edition Ranjan Bose all chapter instant download
55 pages
Example 04.02 Butler With Deliveries-JayDomingoFinal
No ratings yet
Example 04.02 Butler With Deliveries-JayDomingoFinal
75 pages
SIMPLEC Algorithm Application To Body-Fitted Meshes Introduction To Co-Located Schemes
No ratings yet
SIMPLEC Algorithm Application To Body-Fitted Meshes Introduction To Co-Located Schemes
29 pages
100 Days DSA Roadmap
No ratings yet
100 Days DSA Roadmap
21 pages
ML Assignment 02
No ratings yet
ML Assignment 02
8 pages
Tutorial Ex3
No ratings yet
Tutorial Ex3
2 pages
DSP Lab 01-1
No ratings yet
DSP Lab 01-1
4 pages
Electrical Engineering Engineering Control Systems Stability in The Frequency Domain Notes
No ratings yet
Electrical Engineering Engineering Control Systems Stability in The Frequency Domain Notes
13 pages