Szyfr Cezara był używany w starożytnym Rzymie. Jednak dopiero kilkaset lat temu pojawiły się pierwsze zapiski, które wskazywały na próbę złamania szyfru Cezara. Szyfrowanie polega na przesunięciu znaków w prawo lub lewo o n pozycji. Oznacza to, że określony tekst przy określonym alfabecie o n znakach można zaszyfrować maksymalnie na n - 1 sposobów. Niewielka ilość możliwych szyfrogramów powoduje, że wiadomość można odczytać po maksymalnie n - 1 próbach.
Istnieje jednak metoda, która pozwala na znacznie szybsze i łatwiejsze odczytanie ukrytej wiadomości. Jednak przed przystąpieniem należy zwrócić uwagę, że jeśli mamy k takich samych znaków w tekście jawnym to w szyfrogramie będzie ich tyle samo, ale będą jedynie reprezentować inny znak. W określonym alfabecie niektóre znaki występują częściej, a niektóre rzadziej o czym można się przekonać z poniższego wykresu:
Szyfrowanie Cezara nie zmienia częstotliwości występowania wybranego znaku, a jedynie jego reprezentację. Oznacza to, że tworząc wykres dla wszystkich znaków w szyfrogramie można określić o ile było wykonane przesunięcie. Oczywiście metoda ta będzie działała dla dłuższych tekstów, które będą zawierały sensowne wyrazy, a nie np. AAABBBCCC. Oczywiście częstotliwość występowania znaków różnią się pomiędzy alfabetami, więc należy przed przystąpieniem do łamania tą metodą określić w jakim języku będzie ukryta wiadomość. Zwiększy to skuteczność działania przedstawionej dalej metody.
Ze względu na fakt, że przedstawiona metoda łamania szyfrogramów ma charakter poglądowy w trakcie łamania programu nie zostaną uwzględnione polskie litery co zmieni nieco wygląd wykresu:
Działanie programu będzie polegało na próbie utworzenia wykresu na podstawie wpisanego tekstu, a następnie wypisaniu jaki klucz został prawdopodobnie wykorzystany w trakcie szyfrowania. Z założenia tekst składa się tylko z małych liter alfabetu łacińskiego.
Na początek program musi policzyć ile jakich liter dokładnie występuje. Następny krok polega na próbie dopasowania wyliczonych wartości do danych wprowadzonych przez użytkownika na temat wybranego alfabetu. Najprostszy sposób dopasowania polega na znalezieniu znaku z największym procentem, a następnie znalezienie przesunięcia.
(1.) Funkcja findkey() przyjmuje trzy argumenty: alfabet - wszystkie litery z których składa się alfabet tekstu jawnego, wyst - procentowa częstotliwość występowania każdej litery oraz txt - tekst do rozszyfrowania. Wynikiem działania będzie liczba całkowita, która będzie kluczem użytym do szyfrowania oryginalnego tekstu. (2.) Deklaracja zmiennych: dl przechowa ile liter ma alfabet, t - bufor przechowujący wynik przeszukiwania alfabetu oraz txt_dl - zmienna, która zliczy ile jest znaków od a do z w tekście. (3.) Zadeklarowanie tablicy w której będą przechowywane częstotliwości występowania poszczególnych liter w podanym tekście. (4. - 5.) Wyzerowanie wartości występowania znaków. (6.) Dla każdego znaku w tekście: (7.) wyszukujemy znak w alfabecie i (8.) jeśli występuje to (9.) zwiększa się częstotliwość występowania litery oraz (10.) długość tekstu.
(13. - 16.) Dla każdego znaku w tekście wyliczana jest jego procentowa zależność. Wskazane linijki można pominąć. (17. - 25.) Wyszukiwanie przesunięcia polega na znalezieniu maksymalnych wartości dla częstotliwości występowania litery w alfabecie jak również dla częstotliwości występowania liter dla podanego tekstu. (26.) Dealokacja tablicy z wartościami występowania poszczególnych liter oraz (27.) zwrócenie przesunięcia.
W funkcji findkey() została wykorzystana funkcja findChar(), której zadanie polega na znalezieniu litery na podanej liście. Jeśli dana litera jest na liście to zwracany jest jej indeks, a w przeciwnym wypadku wartość -1.
Funkcję można przetestować przy pomocy poniższej funkcji main(). Program na wejściu oczekuje w pierwszej linijce n liter alfabetu zapisanych bez przerw. Następnie należy wpisać n liczb określających częstotliwość występowania poszczególnych liter, a na koniec w pojedynczej linii tekst do rozszyfrowania. Na konsole zostanie wypisana liczba określająca klucz użyty do zaszyfrowania.
Przykładowy prawidłowy sposób wprowadzenia danych to:
Jest to zaszyfrowany pierwszy akapit artykułu. Program prawidłowo rozpoznaje, że użyto przesunięcia 18.
Przedstawiony przykładowy program nie uwzględnia dużych liter, które mogą mieć znaczenie podczas wyznaczania przesunięcia. Przepisz program tak, aby wczytywał zarówno małe jak i duże litery alfabetu, a następnie prawidłowo obliczał ile razy które litera występuje.