Co to jest analiza plików dziennika SEO? Przewodnik dla początkujących
Przeprowadzanie regularnej analizy plików dziennika pomaga specjalistom SEO lepiej zrozumieć, w jaki sposób ich witryna jest indeksowana i nie tylko. Poznaj podstawy tutaj.
Dlaczego pliki dziennika są ważne dla SEO?
Na początek zawierają informacje niedostępne nigdzie indziej
Pliki dziennika to także jeden z niewielu sposobów sprawdzenia rzeczywistego zachowania Google w Twojej witrynie. Dostarczają przydatnych danych do analizy i mogą pomóc w opracowaniu cennych optymalizacji i decyzji opartych na danych .
Regularne przeprowadzanie analizy pliku dziennika może pomóc w zrozumieniu, jaka treść jest indeksowana i jak często, a także odpowiedzieć na inne pytania dotyczące zachowania wyszukiwarek podczas indeksowania w Twojej witrynie.
Może to być trudne zadanie do wykonania, więc ten post stanowi punkt wyjścia do podróży do analizy pliku dziennika.
Co to są pliki dziennika?
Pliki dziennika to zapisy tego, kto uzyskał dostęp do strony internetowej i do jakich treści miał dostęp. Zawierają informacje o tym, kto złożył wniosek o dostęp do strony internetowej (znany również jako „Klient”).
Może to być robot wyszukiwarki, taki jak Googlebot lub Bingbot, albo osoba przeglądająca witrynę. Zapisy plików dziennika są gromadzone i przechowywane przez serwer sieciowy witryny i zwykle są przechowywane przez określony czas.
Jakie dane zawiera plik dziennika?
Plik dziennika zazwyczaj wygląda tak:
27.300.14.1 – – [14/Sep/2017:17:10:07 -0400] „GET https://allthedogs.com/dog1/HTTP/1.1” 200 „https://allthedogs.com” „Mozilla/5.0 (zgodny; Googlebot/2.1; +http://www.google.com/bot.html)”
W podziale, zawiera:
- Adres IP klienta.
- Znacznik czasu z datą i godziną żądania.
- Metoda dostępu do witryny, którą może być GET lub POST.
- Żądany adres URL, który zawiera otwieraną stronę.
- Kod stanu żądanej strony, który wyświetla powodzenie lub niepowodzenie żądania.
- User Agent , który zawiera dodatkowe informacje na temat klienta składającego wniosek, w tym przeglądarkę i bot (na przykład, jeśli pochodzi z telefonu komórkowego lub komputera).
Niektóre rozwiązania hostingowe mogą również dostarczać inne informacje, które mogą obejmować:
- Nazwa hosta.
- Adres IP serwera.
- Pobrano bajty.
- Czas potrzebny na złożenie wniosku.
Jak uzyskać dostęp do plików dziennika
Jak wspomniano, pliki dziennika są przechowywane przez serwer sieciowy przez określony czas i są udostępniane wyłącznie webmasterom witryny.
Metoda dostępu do nich zależy od rozwiązania hostingowego, a najlepszym sposobem, aby dowiedzieć się, w jaki sposób można uzyskać do nich dostęp, jest przeszukanie ich dokumentów, a nawet Google!
W przypadku niektórych można uzyskać dostęp do plików dziennika z sieci CDN lub nawet z wiersza poleceń . Można je następnie pobrać lokalnie na komputer i przeanalizować z formatu, w jakim są eksportowane.
Dlaczego analiza pliku dziennika jest ważna?
Przeprowadzenie analizy pliku dziennika może pomóc w uzyskaniu przydatnych informacji o tym, jak Twoja witryna jest postrzegana przez roboty wyszukiwarek.
Może to pomóc w opracowaniu strategii SEO, znalezieniu odpowiedzi na pytania lub uzasadnieniu optymalizacji, których możesz chcieć wprowadzić.

Nie chodzi tylko o budżet na indeksowanie
Budżet indeksowania to limit przyznawany przez Googlebota za liczbę stron, które będzie indeksować podczas każdej wizyty w witrynie. John Mueller z Google potwierdził, że większość witryn nie musi się zbytnio martwić o budżet indeksowania.
Jednak nadal warto wiedzieć, które strony indeksuje Google i jak często je indeksuje.
Lubię postrzegać to jako upewnienie się, że witryna jest indeksowana zarówno wydajnie, jak i skutecznie . Zapewnienie indeksowania kluczowych stron w witrynie oraz szybkie znajdowanie i indeksowanie nowych stron i często zmieniających się stron jest ważne dla wszystkich witryn.
Różne analizatory SEO
Dostępnych jest kilka różnych narzędzi pomagających w analizie plików dziennika, w tym:
- Splunk.
- Logz.io.
- Analizator plików dziennika Screaming Frog.
Jeśli korzystasz z narzędzia do indeksowania, często istnieje możliwość połączenia danych z pliku dziennika z indeksowaniem witryny w celu dalszego rozszerzenia zestawu danych i uzyskania jeszcze bogatszych informacji na podstawie połączonych danych.
Statystyki dziennika Search Console
Google oferuje również informacje na temat sposobu indeksowania Twojej witryny w raporcie statystyk indeksowania Google Search Console. Zasadniczo raport umożliwia przeglądanie żądań indeksowania od Googlebota z ostatnich 90 dni.
GSC udostępnia też kilka przykładowych stron, które są indeksowane, wraz z datą i godziną żądania.
Warto jednak pamiętać, że jest to przykładowy przykład stron, więc nie będzie wyświetlał pełnego obrazu, który można zobaczyć w plikach dziennika witryny.
Wykonywanie analizy pliku dziennika
Gdy masz już dane z pliku dziennika, możesz ich użyć do przeprowadzenia analizy.
Ponieważ dane z pliku dziennika zawierają informacje za każdym razem, gdy klient uzyskuje dostęp do Twojej witryny, zalecanym pierwszym krokiem w analizie jest odfiltrowanie robotów niebędących wyszukiwarkami, aby wyświetlać tylko dane z botów wyszukiwarek.
Jeśli używasz narzędzia do analizy plików dziennika, powinna istnieć opcja wyboru klienta użytkownika, z którego chcesz wyodrębnić informacje.
Być może masz już jakieś spostrzeżenia, których szukasz lub pytania, na które możesz znaleźć odpowiedzi.
Jeśli jednak nie, oto kilka przykładowych pytań, których możesz użyć, aby rozpocząć analizę pliku dziennika:
- Jaka część mojej witryny jest faktycznie indeksowana przez wyszukiwarki?
- Które sekcje mojej witryny są/nie są indeksowane?
- Jak głęboko jest indeksowana moja witryna?
- Jak często indeksowane są określone sekcje mojej witryny?
- Jak często są indeksowane regularnie aktualizowane strony?
- Jak szybko wyszukiwarki wykrywają i indeksują nowe strony?
- W jaki sposób zmiana struktury/architektury witryny wpłynęła na indeksowanie wyszukiwarek?
- Jak szybko moja witryna jest indeksowana i pobierane zasoby?
Ponadto podajemy kilka sugestii dotyczących elementów, które należy przejrzeć na podstawie danych z pliku dziennika i wykorzystać w analizie.
Kody statusu
Możesz użyć plików dziennika, aby zrozumieć, w jaki sposób budżet indeksowania jest dystrybuowany w Twojej witrynie.
Pogrupowanie kodów stanu przeszukanych stron pokaże, ile zasobów jest przypisywanych ważnym 200 stronom kodowym stanu w porównaniu z niepotrzebnym użyciem na uszkodzonych lub przekierowujących stronach.
Możesz pobrać wyniki z danych pliku dziennika i przestawić je, aby zobaczyć, ile żądań jest przesyłanych do różnych kodów stanu .
Możesz tworzyć tabele przestawne w programie Excel, ale warto rozważyć użycie języka Python do tworzenia tabel przestawnych, jeśli masz dużą ilość danych do przejrzenia.
Tabele przestawne to dobry sposób na wizualizację zagregowanych danych dla różnych kategorii i uważam je za szczególnie przydatne do analizowania dużych zestawów danych w plikach dziennika.

Indeksowalność
Możesz także sprawdzić, w jaki sposób boty wyszukiwarek indeksują strony w Twojej witrynie, które można zindeksować, w porównaniu ze stronami, które nie są indeksowane.
Połączenie danych z pliku dziennika z indeksowaniem witryny może pomóc w zrozumieniu, czy istnieją strony, które mogą marnować budżet na indeksowanie, jeśli nie trzeba ich dodawać do indeksu wyszukiwarki.
Większość i najmniej indeksowanych stron
Dane pliku dziennika mogą również pomóc w zrozumieniu, które strony są najczęściej indeksowane przez roboty wyszukiwarek.
Dzięki temu masz pewność, że kluczowe strony są znajdowane i indeksowane, a nowe strony są skutecznie wykrywane, a regularnie aktualizowane strony są indeksowane wystarczająco często.
Podobnie, będziesz mógł sprawdzić, czy istnieją strony, które nie są indeksowane lub nie są wyświetlane przez roboty wyszukiwarek tak często, jak chcesz.
Głębokość indeksowania i linki wewnętrzne
Łącząc dane z pliku dziennika ze spostrzeżeniami z indeksowania Twojej witryny, będziesz również mógł zobaczyć, jak głęboko w architekturze Twojej witryny indeksują boty wyszukiwarek.
Jeśli na przykład masz strony kluczowych produktów na poziomach czwartym i piątym, ale z plików dziennika wynika, że Googlebot nie indeksuje tych poziomów często, możesz chcieć dokonać optymalizacji, które zwiększą widoczność tych stron.
Jedną z opcji są linki wewnętrzne , które są kolejnym ważnym punktem danych, który można przeglądać w połączonym pliku dziennika i statystykach indeksowania.
Ogólnie rzecz biorąc, im więcej linków wewnętrznych ma strona, tym łatwiej ją znaleźć. Łącząc dane z pliku dziennika z wewnętrznymi statystykami linków z indeksowania witryny, możesz zrozumieć zarówno strukturę, jak i wykrywalność stron.
Możesz także mapować trafienia botów za pomocą wewnętrznych linków i stwierdzić, czy istnieje między nimi korelacja.
Kluczowe kategorie witryn
Podział danych z plików dziennika według struktury folderów pozwala określić, które kategorie są najczęściej odwiedzane przez boty wyszukiwarek i zapewnić, że najważniejsze sekcje witryny są wystarczająco często odwiedzane przez roboty.
W zależności od branży różne kategorie witryn będą miały różne znaczenie. Dlatego ważne jest, aby w poszczególnych witrynach zrozumieć, które foldery są najważniejsze, a które należy najczęściej przeszukiwać.
Dane pliku dziennika w czasie
Zbieranie danych z pliku dziennika w czasie jest przydatne do sprawdzania, jak zachowanie wyszukiwarki zmienia się w czasie.
Może to być szczególnie przydatne, jeśli przenosisz zawartość lub zmieniasz strukturę witryny i chcesz zrozumieć, jak zmiana wpłynęła na indeksowanie witryny przez wyszukiwarki. Możemy też zobaczyć, ile czasu zajęło Google zrozumienie i aktualizacja strategii indeksowania.
Komputery a urządzenia mobilne
Jak wspomniano, dane pliku dziennika pokazują również klienta użytkownika, który został użyty do uzyskania dostępu do strony, a zatem mogą poinformować Cię, czy uzyskano do nich dostęp za pomocą bota mobilnego lub stacjonarnego.
To z kolei może pomóc w zrozumieniu, ile stron w Twojej witrynie jest indeksowanych przez urządzenia mobilne i komputery oraz jak to się zmieniało w czasie.
Może się również okazać, że pewna sekcja Twojej witryny jest indeksowana głównie przez klienta użytkownika na komputerze i dlatego będziesz chciał przeprowadzić dalszą analizę, dlaczego Google preferuje to niż indeksowanie zoptymalizowane pod kątem urządzeń mobilnych.
Optymalizacje do wykonania na podstawie analizy pliku dziennika
Po przeprowadzeniu analizy pliku dziennika i odkryciu cennych informacji mogą wystąpić pewne zmiany, które należy wprowadzić w witrynie.
Na przykład, jeśli odkryjesz, że Google indeksuje dużą liczbę uszkodzonych lub przekierowujących stron w Twojej witrynie, może to zwrócić uwagę na problem polegający na tym, że te strony są zbyt dostępne dla robotów wyszukiwarek.
Dlatego chciałbyś upewnić się, że nie masz żadnych wewnętrznych linków do tych uszkodzonych stron, a także wyczyścić wszelkie wewnętrzne linki przekierowujące.
Możesz również analizować dane z pliku dziennika, aby zrozumieć, jak wprowadzone zmiany wpłynęły na indeksowanie, lub aby zebrać dane przed nadchodzącymi zmianami, które możesz wprowadzić Ty lub inny zespół.
Na przykład, jeśli chcesz wprowadzić zmiany w architekturze witryny, upewnij się, że Google nadal będzie w stanie wykrywać i indeksować najważniejsze strony w Twojej witrynie.
Inne przykłady zmian, które możesz wprowadzić w następującej analizie pliku dziennika, obejmują:
* Usuwanie stron kodowych stanu spoza 200 z map witryn.
* Naprawianie wszelkich łańcuchów przekierowań.
* Uniemożliwianie indeksowania stron nieindeksowanych, jeśli nie ma na nich nic, co byłoby przydatne dla wyszukiwarek.
* Upewnij się, że nie ma ważnych stron, które przypadkowo zawierają tag noindex .
* Dodaj znaczniki kanoniczne, aby podkreślić znaczenie poszczególnych stron.
* Przejrzyj strony, które nie są indeksowane tak często, jak powinny, i upewnij się, że można je łatwiej znaleźć, zwiększając liczbę wewnętrznych linków do nich.
* Zaktualizuj linki wewnętrzne do kanonizowanej wersji strony.
* Upewnij się, że linki wewnętrzne zawsze wskazują na 200 kodów stanu, które można zindeksować.
* Przenieś ważne strony wyżej w architekturze witryny dzięki większej liczbie wewnętrznych linków z bardziej dostępnych stron.
* Oceń, gdzie wydawany jest budżet indeksowania, i w razie potrzeby sugeruj potencjalne zmiany w strukturze witryny.
* Sprawdź częstotliwość indeksowania kategorii witryn i upewnij się, że są one indeksowane regularnie.
Końcowe przemyślenia
Przeprowadzanie regularnej analizy pliku dziennika jest przydatne dla specjalistów SEO, aby lepiej zrozumieć, w jaki sposób ich witryna jest indeksowana przez wyszukiwarki, takie jak Google, a także odkryć cenne informacje, które pomogą w podejmowaniu decyzji na podstawie danych.
Mam nadzieję, że pomogło to Wam w zrozumieniu nieco więcej o plikach dziennika io tym, jak rozpocząć swoją podróż do analizy plików dziennika z kilkoma przykładami rzeczy do przejrzenia.