Jak się pozbyć fanów z Chin

Kolejny wpis ściśle techniczny, tym razem bardzo krótki.

Stawiając bloga każdy oczywiście ma nadzieję na miliony odwiedzin każdego dnia – nie mówiąc już o tłumach reporterów błagających o możliwość przeprowadzenia wywiadu. Oczywiście każdy, kto ma jakiekolwiek doświadczenia w prowadzeniu strony wie, że w praktyce blog niereklamowany będzie także blogiem nieodwiedzanym. Przynajmniej początkowo. Patrząc na doświadczenia z moją stroną na google+, nie spodziewałem się więc jakichkolwiek wizyt przez pierwszy miesiąc. Później – sądziłem, że trafi tutaj może z tuzin osób, guglających przypadkowe słowa kluczowe. Wreszcie – znowu, opierając się o moje doświadczenia – zakładałem, że po publikacji opowiadania w Nowej Fantastyce odwiedzi mnie kolejny tuzin, tym razem już szukających właśnie mnie.

Dygresja:
Ktoś może zapytać: po co stawiasz bloga, jeżeli sądzisz, że przez pierwsze pół roku nikt go nie zauważy? Tę kwestię wyjaśniłem w pierwszym wpisie. W skrócie, wcześniej czy później chciałbym wydawcom posłać jakąś powieść, i wówczas – jeżeli zaczną mnie wyszukiwać na sieci – chciałbym, by zamiast pewnego epizodu związanego z self-publishingiem, trafiali na strony powiązane z opowiadaniami. Blog ma więc przede wszystkim pomóc w podniesieniu ranków niektórych stron, by trafiały wyżej w wynikach wyszukiwania google’a.

Niemniej każdy jest ciekawy, czy stronę może jednak ktoś odwiedza. Na szczęście firma hostująca mojego bloga udostępnia standardowe narzędzia do przeglądania statystyk oraz ich analizy. Gdy je użyłem, zauważyłem coś dziwnego: na mój kompletnie niereklamowany, dopiero co założony blog ktoś wchodził! Co więcej, odwiedzin było nawet dość dużo, jednakże odwiedzający zwykle albo trafiali tylko na stronę główną, albo próbowali wejść na  nieistniejące adresy. Co dziwniejsze, po bliższym przyjrzeniu numery IP odwiedzających nie wyglądały na polskie.

Sięgnąłem po darmowe narzędzie online do sprawdzania lokalizacji IP i odkryłem, że niemal wszyscy odwiedzający pochodzą… z Chin. Niektóre ze zbadanych adresów występowały także w bazie niegrzecznych IP (abuseipd.com).

Wniosek? Albo w Chinach nagle pojawiło się kilka dziesiątków fanów polskiej fantastyki, albo te wszystkie wizyty były lipne. To były boty; albo kradnące zawartość, albo próbujące wyszukać dziur na blogu, by przejąć nad nim kontrolę. W najlepszym razie – boty ściągające dane do analizy treści np. w celach czysto akademickich.

Pierwsza możliwość wydała mi się mało prawdopodobna (co niektórzy może uznają za brak wiary w siebie). Przystąpiłem więc do pracowitego blokowania najpierw pojedynczych IP, a potem całych zakresów. Po kilku dniach chyba wyciąłem cały ruch z Chin. Od tego czasu pojawiają się głównie zabłąkane boty z Ukrainy, Rosji albo Meksyku, próbujące niemrawo sprawdzić, czy nie dałoby się znaleźć jakiejś furtki do bloga. W tym wypadku blokuję konkretne IP i  na parę dni mam spokój.

Problem polega na tym, że próby wejścia zablokowanych botów na stronę wciąż są odnotowane jako wizyty, nawet chociaż bot dostaje zwrotnie zero bajtów (co w sieci www jest odpowiednikiem pokazania środkowego palca). Przynajmniej nie zżera transferu; ale statystyki i tak zakłóca.

Wpis należałoby zakończyć jakąś puentą: pomijając kwestie związane z bezpieczeństwem, wizyty botów są wkurzające, bo zakłócają statystyki odwiedzin. W przypadku dużych stron, które faktycznie odwiedzają tłumy ludzi, odwiedziny botów są pomijalne. Jeżeli jednak ktoś ma mały blog i chwali się, że dziennie ma na przykład sto odwiedzin, to warto sprawdzić, ile ruchu z tej setki generowanego jest przez boty. Ułamek procenta? Procent? Dwa? Jeżeli przykład mojego bloga jest reprezentatywny, to podejrzewam, że dla małych blogów procent może być większy. Ja średnio miałem blisko dwa tuziny wizyt botów dziennie, a w niektóre dni znacznie więcej.

Z drugiej strony, jeżeli to faktycznie byli mali, skośnoocy wielbiciele polskiej fantastyki z Chin, to może właśnie utraciłem szansę zaistnienia na miliardowym rynku :D.

PS: Po napisaniu tego wpisu, wszedłem do panelu administracyjnego. Poniżej lista 41 IP (większość z Chin, po jednym z Tajwanu, Korei i Arabii Saudyjskiej), które mnie odwiedziły i które za chwilę zablokuję. Czterdzieści jeden botów w ciągu ostatniej półtorej godziny. Blokując, zwykle wpisuję całe zakresy; nie chce mi się wyszukać wszystkich zakresów przypisanych Chinom i ich zablokować, bo tego też jest dużo.

27.212.153.60
27.27.230.248
27.44.35.216
42.92.181.123
49.89.217.219
58.129.143.29
58.208.50.241
60.189.65.28
82.147.220.206
111.40.116.175
111.75.241.18
112.12.14.117
112.227.120.75
112.236.3.184
114.248.218.125
115.51.87.173
116.208.72.224
116.54.212.179
118.122.138.152
119.109.9.85
119.183.118.66
119.186.179.131
120.193.227.51
122.117.65.169
122.243.77.92

123.139.173.122
123.54.69.39
124.152.125.3
171.115.209.18
175.47.21.197
180.140.115.236
180.175.53.22
183.215.74.190
183.57.20.86
183.57.20.86
183.93.62.158
183.96.109.35
218.15.180.36
218.77.80.131
222.138.45.176
223.67.184.59

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *