Gdy kończy się okres, w którym szkoła mogła przechowywać dane osobowe, wówczas konieczne jest ich usunięcie. Przejawem usuwania danych osobowych jest zaś anonimizacja.
Anonimizacja danych to przetwarzanie danych w taki sposób, aby nie istniała już możliwość wykorzystania ich do zidentyfikowania osoby fizycznej za pomocą „wszystkich sposobów, jakimi może posłużyć się” administrator danych lub osoba trzecia. Innymi słowy, anonimizacja oznacza przetwarzanie danych osobowych w celu osiągnięcia ich anonimowości. W konsekwencji zanonimizowane dane nie są danymi osobowymi, ponieważ nie wiążą się ze zidentyfikowaną lub możliwą do zidentyfikowania osobą fizyczną. Anonimizacja ma charakter nieodwracalny. Dane osobowe są bowiem przetwarzane w celu nieodwracalnego uniemożliwienia zidentyfikowania osoby, której dane dotyczą.
Anonimizacja jest techniką stosowaną do danych osobowych w celu uzyskania nieodwracalnej anonimizacji. Z przywołanej powyżej opinii nr 05/2014 z 10 kwietnia 2014 r. w sprawie technik anonimizacji wynika, że wdrażając proces anonimizacji danych, należy mieć na uwadze, iż:
dane osobowe powinny być przetwarzane w celu nieodwracalnego uniemożliwienia zidentyfikowania osoby, której dane dotyczą;
możliwe jest stosowanie wielu technik anonimizacji;
dokonując anonimizacji, należy uwzględnić wszystkie sposoby, jakimi może posłużyć się administrator danych i osoby trzecie w celu przeprowadzenia identyfikacji;
wybierając metodę anonimizacji, należy uwzględnić ryzyko potencjalnego zidentyfikowania zanonimizowanych danych, w tym wagę i prawdopodobieństwo jego wystąpienia.
RODO nie wskazuje, w jaki sposób należy przeprowadzić proces anonimizacji ani jakimi kryteriami należy się kierować przy wyborze metody anonimizacji. Decyzja w tym zakresie została pozostawiona administratorowi danych.
Pomocne wskazówki sformułowała Grupa Robocza Art. 29, która wskazała, że wybór odpowiedniej metody anonimizacji powinien być poprzedzony oceną tej metody na bazie trzech kryteriów:
czy nadal możliwe jest wyodrębnienie konkretnej osoby fizycznej;
czy nadal możliwe jest powiązanie zapisów dotyczących konkretnej osoby fizycznej; oraz
czy można wywnioskować informacje w odniesieniu do konkretnej osoby fizycznej.
Wobec tego dokonując wyboru metody anonimizacji, mając na uwadze aktualny stan technologii, należy uwzględnić trzy czynniki ryzyka.
Wyodrębnienie |
możliwość wydzielenia niektórych lub wszystkich zapisów identyfikujących określoną osobę fizyczną w zbiorze danych |
Możliwość tworzenia powiązań |
zdolność do powiązania co najmniej dwóch zapisów dotyczących jednej osoby lub grupy osób, których dane dotyczą (w tej samej bazie danych lub w dwóch różnych bazach danych) |
wnioskowanie |
możliwość wydedukowania ze znacznym prawdopodobieństwem wartości danego atrybutu z wartości zbioru innych atrybutów |
W ramach wskazanych kryteriów i rodzajów ryzyka Grupa Robocza Art. 29 wyróżniła kilka typów technik anonimizacji. Techniki anonimizacji danych zasadniczo opierają się na dwóch metodach, tj. na randomizacji (która oznacza zmianę prawdziwości danych w celu wyeliminowania ścisłego związku między danymi a konkretną osobą fizyczną) i na uogólnianiu (tzn. generalizowaniu lub osłabianiu cech osób, których dane dotyczą, poprzez modyfikowanie odpowiedniego zakresu lub rzędu wielkości). Wybór odpowiedniej techniki anonimizacji wymaga ustalenia celów procesu anonimizacji oraz rozważenia ograniczeń, które wiążą się ze stosowaniem konkretnej techniki.
Zmiana prawdziwości danych skutkuje niepewnością danych, tzn. nie można ich już odnieść do określonej osoby fizycznej. Randomizacja nie jest jednakże metodą stuprocentowo skuteczną, dane dalej odnoszą się bowiem do jednej osoby, istnieje więc ryzyko wnioskowania. W związku z tym w zależności od okoliczności wymagane może być stosowanie dodatkowych technik, tj.:
dodawanie zakłóceń, które polega na modyfikowaniu atrybutów w zbiorze danych w taki sposób, aby były one mniej dokładne, przy jednoczesnym zachowaniu ogólnej dystrybucji;
permutacja, która polega na tasowaniu wartości atrybutów w tabeli, tak aby niektóre z nich były sztucznie powiązane z różnymi osobami, których dane dotyczą;
prywatność różnicowa, która jest stosowana, gdy administrator danych generuje zanonimizowane widoki zbioru danych, jednocześnie zachowując kopie danych pierwotnych.
W opinii nr 05/2014 z 10 kwietnia 2014 r. w sprawie technik anonimizacji Grupa Robocza Art. 29 wskazała przykłady stosowania tych dodatkowych technik anonimizacji, ich zalety i wady, a także najczęściej popełniane błędy.
Technika dodawania zakłóceń:
Drugim rodzajem technik anonimizacji jest uogólnianie. Podstawową zaletą tej grupy technik jest skuteczne uniemożliwienie wyodrębniania, choć nie w każdym przypadku. Uogólnianie obejmuje takie techniki, jak:
agregacja i kanonimizacja, które mają na celu uniemożliwienie wyodrębnienia osoby, której dane dotyczą, poprzez zgrupowanie tych osób z co najmniej K innymi osobami fizycznymi;
ldywersyfikacja to rozszerzenie metody k-anonimizacji, ma ona na celu uniemożliwienie wyodrębnienia osoby, której dane dotyczą, poprzez przyjęcie, że dla każdej grupy wartości powinno występować co najmniej L różnych wartości;
tbliskość stanowi udoskonalenie l-dywersyfikacji, ma ona na celu utworzenie równoważnych klas, które odzwierciedlają początkową dystrybucję atrybutów w tabeli.
Brak konsultacji
w najbliższym czasie
Brak nadchodzących wydarzeń