Strona główna » Algorytmy » Artykuły » Brakujące Elementy
 

Brakujące Elementy

Zadanie

Dane są dwie tablice posortowanych liczb. Liczby zapisane w tablicach mogą się powtarzać. Zadanie polega na zliczeniu ile liczb z obydwu tablic nie ma swojego odpowiednika w drugiej tablicy.

Weźmy przykładowo tablicę {1, 2, 3, 5} oraz {2, 2, 3, 4, 5}. Jedynie 2, 3, 5 mają swoje odpowiedniki w drugiej tablicy niż one same. Oznacza to, że tablice różnią się trzema elementami.

Analiza zadania

Najprostszy algorytm, które pozwoli rozwiązać to zadanie brzmi następująco: pobierz pierwszy element z tablicy 1 i wyszukaj go w tablicy 2. Jeśli istnieje to usuń go. W przeciwnym razie zwiększ licznik różnych elementów. Nie byłby to jednak najefektywniejszy algorytm, ponieważ jego złożoność wynosi O(n1n2) co dla tablic o zbliżonej długości daje złożoność kwadratową. Algorytm można zoptymalizować, ponieważ nie została wykorzystana informacja o tym, że tablice są posortowane. Wykorzystanie wyszukiwania binarnego pozwoliłoby na zmniejszenie złożoności do O(nlog(n)), ale nie jest najlepsze możliwe rozwiązanie.

Algorytm można napisać tak, aby miał złożoność liniową O(n). Algorytm rozpoczynamy od ustalenia indeksów dla każdej tablicy na 0. Następnie porównujemy elementy aktualnie wskazywane przez indeksy. Jeśli elementy są identyczne to zwiększamy obydwa indeksy. Jednak jeśli elementy są różne to zwiększamy licznik różnych elementów, a następnie zwiększamy indeks dla tablicy, która ma mniejszy element. Proces ten powtarzamy, aż w którejś tablicy nie będzie więcej elementów.

Przykład

Rozpatrzmy ponownie dwie tablice {1, 2, 3, 5} oraz {2, 2, 3, 4, 5}. Kolejno zostaną wykonane następujące operacje:

Indeks 1Indeks 2ElementyKomentarz
001 i 2Różne, zwiększamy indeks 1 i licznik różnych elementów
102 i 2Identyczne, zwiększamy oba
213 i 2Różne, zwiększamy indeks 2 i licznik różnych elementów
223 i 3Identyczne, zwiększamy oba
335 i 4Różne, zwiększamy indeks 2 i licznik różnych elementów
345 i 5Identyczne, zwiększamy oba

W tym przypadku obydwa indeksy przekraczają długości tablic równocześnie. Ostatecznie pomiędzy tablicami istnieją dokładnie 3 różne elementy.

Implementacja

Poniżej znajduje się przykładowa implementacja funkcji ileBrakujacychElementow(), która dla podanych dwóch tablic sprawdza ile jest różnych elementów.

C++C#
Python
  1. def ileBrakujacychElementow(tab1, tab2):
  2.   i1, i2 = 0, 0
  3.   brakujacych = 0
  4.   while (i1 < len(tab1) and i2 < len(tab2)):
  5.     if (tab1[i1] == tab2[i2]):
  6.       i1 += 1
  7.       i2 += 1
  8.     else:
  9.       brakujacych += 1
  10.       if (tab1[i1] > tab2[i2]):
  11.         i2 += 1
  12.       else:
  13.         i1 += 1
  14.   brakujacych += len(tab1) - i1
  15.   brakujacych += len(tab2) - i2
  16.   return brakujacych;

Kolejne pary elementów są porównywane. Dla takich samych elementów zwiększane są oba indeksy i1 oraz i2, ale dla różnych zwiększany jest licznik brakujących elementów, a następnie odpowiedni indeks tj. tej tablicy, której element jest mniejszy. Na koniec bardzo ważne jest, aby pamiętać, że któraś tablica może wciąż posiadać elementy do sprawdzenia, więc należy je dodać jako elementy brakujące!

Testowanie funkcji

Do przetestowania kodu można skorzystać z poniższego fragmentu kodu, który wczytuje od użytkownika potrzebne dane, a następnie wypisuje na ekran ile jest brakujących elementów:

C++C#
Python
  1. tab1 = [int(x) for x in input("Podaj elementy tablicy 1\n").split()]
  2. tab2 = [int(x) for x in input("Podaj elementy tablicy 2\n").split()]
  3. wynik = ileBrakujacychElementow(tab1, tab2);
  4. print("Brakuje " + str(wynik) + " elementów")