S01E09 [Prywatność w sieci] — Jak firmy zarabiają na Twoich metadanych
„Z rzeczy istniejących jedne są od nas zależne, inne niezależne.” — Epiktet, Encheiridion”

Treść jest głośna.
Metadane są ciche.
Treść trzeba przeczytać, zrozumieć, zinterpretować.
Metadane wystarczy policzyć.
I dlatego to nie treść jest dziś najcenniejsza.
Najcenniejszy jest kontekst, który powstaje mimochodem — nawet wtedy, gdy nie publikujesz, nie piszesz, nie nagrywasz i nie mówisz.
1. Czym naprawdę są metadane — głębiej niż „dane o danych”
W podręcznikach przeczytasz, że metadane to „dane o danych”.
To prawda, ale to definicja tak płytka, że właściwie nic nie mówi.
Może o to chodzi, bo po co drążyć temat?
W praktyce metadane to:
- czas (kiedy coś robisz),
- częstotliwość (jak często),
- intensywność (jak długo),
- lokalizacja (gdzie),
- trajektoria (skąd i dokąd),
- relacje (z kim),
- urządzenie (na czym),
- sekwencja (w jakiej kolejności),
- odchylenia (co jest nietypowe),
- korelacje (co występuje razem).
To nie są „dodatki” – to jest matematyczny opis Twojego życia.
I co najważniejsze: metadane powstają zawsze, nawet jeśli treść nie powstaje nigdy.
2. Jak powstają metadane — warstwa po warstwie
Każde urządzenie, które łączy się z siecią, generuje metadane w kilku równoległych warstwach:
Warstwa 1 — sieć (IP, routing, BTS, TTL) Tu powstają informacje o:
- Twojej lokalizacji,
- Twoim operatorze,
- Twojej prędkości przemieszczania,
- Twojej strefie czasowej,
- Twojej aktywności w czasie.
To jest poziom, którego nie da się wyłączyć.
To jest fundament internetu.
Warstwa 2 — urządzenie (IMEI, MAC, sensory) Tu powstają informacje o:
- modelu smartfona,
- stanie baterii,
- orientacji urządzenia,
- ruchu (akcelerometr, żyroskop),
- sile sygnału,
- pobliskich sieciach Wi-Fi.
Twój smartfone wie, czy biegniesz, jedziesz, siedzisz, śpisz, czytasz, czy tylko odblokowałeś ekran „na sekundę”.
Warstwa 3 — aplikacje (API calls, request headers) Tu powstają informacje o:
- tym, z jakich aplikacji korzystasz,
- jak często,
- o której godzinie,
- jak długo,
- w jakiej kolejności.
Aplikacje nie muszą wiedzieć, co robisz.
Wystarczy, że wiedzą kiedy i jak.
Warstwa 4 — zachowanie (pattern analysis)
To najcenniejsza warstwa.
Tu powstaje:
- Twój rytm dnia,
- Twoje nawyki,
- Twoje anomalie,
- Twoje relacje,
- Twoje podatności.
To nie są dane.
To jest sygnatura człowieka.
3. Fingerprinting — identyfikacja bez ciasteczek
Gdy przeglądarki zaczęły blokować cookies, firmy nie zrezygnowały z identyfikacji.
Przerzuciły się na fingerprinting — technikę, która tworzy unikalny „odcisk palca” Twojego urządzenia.
Składa się na niego m.in.:
- rozdzielczość ekranu,
- czcionki,
- sterowniki,
- GPU,
- wersja systemu,
- język,
- strefa czasowa,
- kolejność renderowania elementów,
- mikroopóźnienia procesora.
Fingerprinting jest tak skuteczny, że potrafi rozpoznać Cię nawet wtedy, gdy:
- wyczyścisz historię,
- zmienisz IP,
- użyjesz VPN,
- otworzysz okno incognito.
To nie jest „śledzenie”. To jest rozpoznawanie.
4. Korelacja — najpotężniejsze narzędzie analityczne świata
Metadane są jak pojedyncze nuty.
Dopiero korelacja tworzy z nich melodię.
Przykład:
Twój telefon loguje się do BTS-a o 6:42.
O 6:44 loguje się drugi telefon.
O 7:03 oba urządzenia przemieszczają się razem.
O 17:12 znów są w tym samym miejscu.
System nie musi znać treści Waszych rozmów.
Wie, że mieszkacie razem.
To samo działa dla:
- współpracowników,
- kochanków,
- aktywistów,
- dziennikarzy,
- informatorów,
- klientów,
- polityków.
Korelacja to matematyka relacji.

5. RTB — aukcje Twojej uwagi i Twojego profilu
RTB (Real-Time Bidding) to system, w którym Twoje metadane są sprzedawane w czasie rzeczywistym, zanim strona zdąży się załadować.
Wysyłane są setki parametrów:
- lokalizacja,
- model urządzenia,
- historia aktywności,
- przewidywany dochód,
- stabilność finansowa,
- prawdopodobieństwo zakupu,
- ryzyko kredytowe,
- podatność na impuls.
To nie jest reklama.
To jest aukcja Twojej przyszłości.
6. Co można wywnioskować z samych metadanych — bez treści
Z samych metadanych można określić:
- czy jesteś w związku,
- czy masz depresję,
- czy zmieniasz pracę,
- czy masz problemy finansowe,
- czy chorujesz,
- czy jesteś w ciąży,
- czy masz romans,
- czy jesteś w grupie ryzyka,
- czy planujesz wyjazd,
- czy jesteś podatny na manipulację.
To nie są teorie.
To są modele predykcyjne, które działają na poziomie populacji, a potem dopasowują jednostkę.
7. Dlaczego metadane są cenniejsze niż treść
Treść jest chaotyczna.
Treść trzeba analizować.
Treść trzeba rozumieć.
Metadane są:
- czyste,
- strukturalne,
- przewidywalne,
- łatwe do korelacji,
- łatwe do automatyzacji,
- łatwe do sprzedaży.
Treść mówi, co powiedziałeś.
Metadane mówią, kim jesteś.

8. Najważniejsza prawda o metadanych
Metadane nie są „mniej wrażliwe”.
Metadane są bardziej wrażliwe niż treść.
Bo treść mówi o tym, co robisz.
A metadane mówią o tym, kim jesteś, jak żyjesz i co zrobisz jutro.
Nie muszą znać Twojej treści.
Wystarczy, że znają Twój cień.
A cień — w przeciwieństwie do treści — nigdy nie kłamie.
Nie panujesz nad swoją pracą — możesz ją stracić z dnia na dzień.
Nie masz władzy nad innymi ludźmi — nie zmusisz nikogo, by Cię lubił, szanował czy rozumiał.
Nie kontrolujesz nawet własnego zdrowia i ciała — potrafi odmówić posłuszeństwa w najmniej oczekiwanym momencie.
Nie masz władzy nad niczym, poza możliwością dokonywania słusznych wyborów.
Dlatego tej jedynej władzy, którą naprawdę masz — nie ceduj na systemy,
które z Twojego cienia uczą się przewidywać Twoje zachowania i wpływać na Twoje przyszłe wybory.