Sortowanie Funkcją Skrótu to propozycja algorytmu, który pozwala przyśpieszyć proces sortowania poprzez podzielenie sortowanej listy na mniejsze jej fragmenty poprzez zastosowanie funkcji skrótu. Powstałe części można posortować dowolnym innym algorytmem, albo kontynuować wykonywanie poprzez funkcję skrótu, ale wtedy dużo się traci na wydajności.
W celu podzielania tablicy na k części, które można posortować oddzielnie dzielimy zakres liczb tablicy tj. różnicę minimum i maksimum przez żądaną ilość części. Wynik zaokrąglamy w górę, aby mieć pewność, że wszystkie liczby znajdą się w pewnej grupie. Następnie skanujemy tablicę i wyznaczamy ile liczb należy do każdej grupy. Na podstawie tych informacji generowana jest tablica indeksów każdej grupy. Ostatni krok polega na przejrzeniu tablicy jeszcze raz, ale tym razem po wyliczeniu grupy pobieramy jej indeks i tam zapisujemy liczbę w tablicy wynikowej, a potem zwiększamy indeks. Każdy wyznaczony fragment należy posortować oddzielnie!
Grupę dla danej liczby wyznaczamy z funkcji skrótu. Dla dowolnej liczby n numer grupy to g = floor((n - min) / rozmiar_części), gdzie min to minimalna wartość w tablicy, a rozmiar_części = (max - min) / k.
Sortujemy tablicę L = [1, 9, 2, 4, 8, 10, 6, 5, 0, 7]. Deklarujemy, że chcemy podzielić tablicę na k = 3 części. Pierwszy krok polega na wyznaczeniu zakresu wartości: min = 0, a max = 10. Z tego wynika, że rozmiar każdej części to ceil((10 - 0) / 3) = ceil(3.33..) = 4. Gdyby nie zaokrąglenie w górę to powstałaby 3 grupy po 3 elementy, a więc jeden byłby poza.
Pierwszy element to 1, a więc g = floor((1 - 0) / 4) = 0. Zwiększamy zatem liczebność grupy 0. Poniżej zostały podane liczby oraz ich przydział do grupy g:
Liczba | 1 | 9 | 2 | 4 | 8 | 10 | 6 | 5 | 0 | 7 |
---|---|---|---|---|---|---|---|---|---|---|
Grupa | 0 | 2 | 0 | 1 | 2 | 2 | 1 | 1 | 0 | 1 |
Ostatecznie wiemy, że w grupie 0 są 3 elementy, w grupie 1 są 4 elementy, a w ostatniej 3. Teraz na podstawie tych informacji można zbudować tablice indeksów:
Grupa | 0 | 1 | 2 |
---|---|---|---|
Liczb | 3 | 4 | 3 |
Indeks | 0 | 3 | 7 |
Teraz chcą zapisać liczbę 1 wyznaczamy g = 0. Pobieramy indeks grupy 0 czyli 0 i pod tym indeksem zapisujemy liczbę. Na koniec zwiększamy indeks. Poniżej został przedstawiony ten proces dla pozostałych liczb:
Liczba | Grupa | Indeksy | Wynik |
---|---|---|---|
1 | 0 | 0, 3, 7 | 1, _, _; _, _, _, _; _, _, _ |
9 | 2 | 1, 3, 7 | 1, _, _; _, _, _, _; 9, _, _ |
2 | 0 | 2, 3, 8 | 1, 2, _; _, _, _, _; 9, _, _ |
4 | 1 | 2, 3, 8 | 1, 2, _; 4, _, _, _; 9, _, _ |
8 | 2 | 2, 4, 8 | 1, 2, _; 4, _, _, _; 9, 8, _ |
10 | 2 | 2, 4, 9 | 1, 2, _; 4, _, _, _; 9, 8, 10 |
6 | 1 | 2, 4, 10 | 1, 2, _; 4, 6, _, _; 9, 8, 10 |
5 | 1 | 2, 5, 10 | 1, 2, _; 4, 6, 5, _; 9, 8, 10 |
0 | 0 | 3, 6, 10 | 1, 2, 0; 4, 6, 5, _; 9, 8, 10 |
7 | 1 | 3, 6, 10 | 1, 2, 0; 4, 6, 5, 7; 9, 8, 10 |
Ostatecznie sortowana tablica została podzielona na trzy części: [1, 2, 0], [4, 6, 5, 7], [9, 8, 10]. Każda z nich wymaga oddzielnego posortowania dowolną metodą.
Algorytm dla małych wartości nie pozwala przyśpieszyć sortowanie, ponieważ w celu podziału wymaga on, aż trzykrotnego przejrzenia tablicy. Niemniej warto pamiętać o tym, że dla sortowania bąbelkowego o złożoności O(n2) podział może dać znaczne przyśpieszenie. Przypuśćmy, że lista dzieli się na równej długości k części. Wtedy złożoność wyniesie O(k·(n/k)2 = n2/k). Co ciekawe jeśli k = n to dane zostaną posortowane liniowo, ale pamiętajmy, że wtedy algorytm wymaga znacznie więcej dodatkowej pamięci. Należy pamiętać, że algorytm dzielenie wartości ma złożoność liniową O(n).
Poniżej został przedstawiony kod algorytmu, który sortuje przy użyciu sortowania funkcją skrótu. Przyjmuje on liczby do posortowania oraz żądaną ilość części k.
Na początku wyznaczone zostaną wartości minimum oraz maksimum. Kolejny krok to wyznaczenie ile liczb na leży do której grupy i na tej podstawie wyliczane są indeksy. Potem liczby zostają przepisane do swojej części tablicy. Ostatni krok to posortowanie każdej części oddzielnie.
W celu przetestowania napisanej funkcji można skorzystać z poniższego fragmentu programu.