Swobodnie korzystaj z danych. Od Analytics do BigQuery

Co zrobić, jeśli na nurtujące Cię pytanie marketingowe nie możesz odpowiedzieć za pomocą samych raportów z Google Analytics?

Na przykład, może Cię interesować znalezienie konkretnej kombinacji miast, grup wiekowych, źródeł marketingowych czy urządzeń, które generują największą liczbę transakcji i przychodów z e-commerce.

W zwykłej, darmowej wersji Google Analytics byłoby to trudne do zrobienia, ponieważ do raportu możesz jednocześnie dodać tylko dwa wymiary (jeden wymiar podstawowy i jeden drugorzędny).

Nawet jeśli tworzysz niestandardowy raport lub budujesz zaawansowany segment na bazie jednego z wymiarów, to i tak odniesiesz wrażenie wykonywania nużącej i powtarzalnej pracy.

Im głębszego wglądu w dane potrzebujesz, tym trudniej będzie Ci go uzyskać, korzystając jedynie z raportów Google Analytics.

Wyjściem z takich sytuacji jest wyeksportowanie danych z Google Analytics do Google BigQuery i uzyskanie wglądu w surowy zbiór danych poprzez uruchomienie własnych zapytań.

W następnych sekcjach pokażemy Ci jak to zrobić. Skonfigurujemy data pipeline, który prześle Twoje dane do Google BigQuery, a następnie uruchomimy zapytania, które dostarczą Ci potrzebnych odpowiedzi.

3 kroki od Analytics do BigQuery

Wprowadzanie danych do BigQuery sprowadza się do 3 etapów.

  1. Wybór odpowiedniej kombinacji metryk i wymiarów z Google Analytics, która pomoże Ci szybko odpowiedzieć na pytania dotyczące biznesu.
  2. Uruchomienie ETL (rodzaj data pipeline), by przenieść dane z Google Analytics do Google BigQuery.
  3. Eksplorowanie danych w Data Studio, a następnie tworzenie zapytań o nie w BigQuery.

Połącz odpowiednie wymiary i metryki

Jak wiadomo, Google Analytics to metryki i wymiary.

Ogólnie rzecz biorąc, wszystkie metryki po prostu mierzą wymiary w określony sposób, np. poprzez liczenie, uśrednianie, sumowanie itp. Przykładowe metryki to czas sesji, unikalne wyświetlenia strony lub liczba transakcji. Przykładowe wymiary to źródło lub medium marketingowe, kategoria urządzenia, miasto itp.

Raporty analityczne są tworzone poprzez połączenie wymiarów i metryk. Przykładowo dla raportu Acquisition, źródłami będą wymiary i czas na stronie, a metrykami realizacja celów i konwersje.

Aby łączenie Analytics-BigQuery dawało sensowne wyniki, należy wybrać właściwą kombinację metryk i wymiarów, które mają być przesyłane przez data pipeline. Kluczem do właściwego połączenia wymiarów i metryk jest spojrzenie na ich zakres.

Każdy wymiar i metryka ma tylko jeden zakres: użytkownik, sesja lub interakcja (jest też zakres produktu – na razie nieistotny). Zakres informuje o tym, kiedy poszczególny wymiar lub metryka wypełniają rzeczywiste dane.

Zakres interakcji opisuje poszczególne akcje – zdarzenie, transakcja lub wyświetlenie stron. Przykładami wymiarów i metryk dla zakresu interakcji mogą być np. wyszukiwane hasła, kategorie zdarzeń, czas na stronie. Są one ustawione na moment interakcji. To sprawia, że zakres interakcji jest równy samej interakcji.

Metryki i wymiary z zakresem sesji są ustawiane jednorazowo dla serii interakcji, którą nazywamy sesją. Opisaliśmy już szczegółowo, czym jest sesja Google Analytics. Typowe wymiary i metryki zakresu sesji obejmują np. źródło, medium, wskaźnik odrzuceń.

Zakres użytkownika agreguje dane pochodzące z wielu sesji danego użytkownika. Przykładowymi danymi tego zakresu mogą być np. wiek, płeć, miasto. Wszystkie wymiary i metryki ustawione są na poziomie unikalnego identyfikatora użytkownika zwanego client ID. Identyfikator ten jednak oznacza raczej przeglądarkę, niż faktyczną osobę. Zatem nie można traktować go jako dokładnego odwzorowania zachowania konkretnego człowieka.

Tworzenie raportów, czy to wewnątrz Google Analytics, czy na zewnątrz – np. w BigQuery, ma sens tylko wtedy, gdy łączysz wymiary i metryki z tego samego zakresu. Jeśli połączysz metryki i wymiary z różnych zakresów, to albo nie otrzymasz żadnych danych, albo będą one bardzo niedokładne.

Google Analytics nie powstrzyma Cię przed krzyżowaniem metryk i wymiarów z różnych zakresów i wygeneruje regularny raport. Jednak dane te będą absolutnie pozbawione wartości.

Dlatego kluczowe znaczenie ma zrozumienie różnic pomiędzy zakresami i wybór właściwej kombinacji metryk i wymiarów w raportach Analytics-BigQuery.

Aby sprawdzić, które dane mogą być łączone, użyj Google Analytics Dimensions & Metrics explorer. Zaleta tego narzędzia polega tym, że metryki lub wymiary, których nie da się połączyć, zostaną zaznaczone na szaro. Spójrz poniżej.

W naszym raporcie postaramy się odkryć, jak skuteczne w generowaniu zaangażowania, transakcji i sprzedaży są poszczególne kombinacje kategorii urządzeń, miast i źródeł przejęć.

Właśnie dlatego nasz data pipeline będzie wysyłał dane z następujących pól Google Analytics do BigQuery (ta kombinacja przeszła test Dimensions & Metrics Explorer):

  1. Metryki: Realizacja celów, Transakcje, Przychody, Wartość ogółem.
  2. Wymiary: Acquisition Source / Medium, Rodzaj Urządzenia, Miasto, Domena.

Zauważ, że źródło Acquisition Source / Medium ma zasięg użytkownika. Standardowy zakres Source / Medium ma zakres sesji. Według Google, pierwsze z nich jest źródłem, z którego użytkownicy zostali pozyskani i pochodzi z pierwszej sesji użytkowników.

Konfigurowanie data pipeline

Do dzieła!

W naszym przypadku skonfigurujemy bardzo specyficzny data pipeline o nazwie ETL. ETL to skrót od Extract, Transform, Load.

ETL jest zautomatyzowanym procesem, który polega na pobieraniu nowych danych ze źródła (np. Google Analytics), przekształcaniu ich w określony sposób i przesyłaniu do miejsca docelowego (np. bazy danych jak BigQuery). Proces ten jest regularnie powtarzany, np. co 12 godzin.

BigQuery to właściwie magazyn z danymi. Pomyśl o nim jako o miejscu do przechowywania i przetwarzania dużej ilości danych za stosunkowo niewielką cenę.

Zbudowanie własnego narzędzia ETL wymaga ciężkiej pracy. Nie będziemy tego robić. Użyjemy za to jednego z gotowych narzędzi ETL, aby wykonało trudne zadania za nas. Narzędzie, którego będziemy używać, nazywa się Stitch.

Stitch jest jednym z najlepszych narzędzi ETL na świecie. Potrafi łączyć i pobierać dane z wielu znanych źródeł marketingowych (np. z Salesforce, AdRoll, Amplituda itp.), a następnie przesłać je do wielu baz danych i miejsc docelowych (MySQL, PostgreSQL itp.), poprawnie formatując je podczas całego procesu.

Teraz wspólnie skonfigurujmy konto Stitch.

Wejdź na stronę internetową Stitch i zapisz się na bezpłatny trial. Darmowe konto daje Ci nieograniczoną ilość danych w okresie próbnym i 5 milionów wierszy punktów danych.

Pomyślne założenie konta przenosi Cię do drugiego etapu – Adding an integration.

W tym miejscu wybierasz swoje źródło danych. W naszym przypadku będzie to Google Analytics. Spójrz, z ilu narzędzi możesz pobrać dane!

Kliknij pasek wyszukiwania po lewej stronie, aby wybrać Google Analytics.

Kliknij ikonę Google Analytics. Zostaniesz przeniesiony do panelu konfiguracyjnego. Wprowadź nazwę swojej integracji.

Wybieramy okres wyszukiwania danych z domyślną integracją co 30 dni. Możesz go zmienić według własnego upodobania. Częstotliwość replikacji wskazuje Stitchowi, jak często powinien synchronizować świeże dane.

Kliknij Authorise.

Po zalogowaniu się zobaczysz listę paneli Google Analytics do połączenia. Wybierz ten, z którego chcesz zsynchronizować swoje dane.

Następnie należy wybrać kombinację metryk i wymiarów, z których mają być synchronizowane dane. Możesz wybrać maksymalnie 10 metryk i 7 wymiarów.

W tym kroku po prostu zatwierdzamy to, co wybraliśmy wcześniej. Powinno to wyglądać tak, jak poniżej. Stitch podwójnie sprawdzi Twoją kombinację wymiarów i metryk dla Ciebie.

Kliknij przycisk Zapisz, a pojawi się kolejny ekran z prośbą o wybranie miejsca docelowego. Jak wiesz, będziemy wysyłać dane do Google BigQuery, a zatem to jest nasz wybór.

Zgodnie z instrukcją, aby BigQuery mógł służyć jako miejsce docelowe, musisz najpierw posiadać istniejące konto BigQuery z uprawnieniami administratora, jak również projekt z włączonym rozliczeniem i dołączoną kartą kredytową.

Zróbmy to teraz!

Aby założyć swoje konto BigQuery, odwiedź oficjalną stronę internetową i wybierz bezpłatną wersję próbną. Zaakceptuj warunki użytkowania i kontynuuj. Powinieneś znaleźć się w konsoli BigQuery.

Wybierz tworzenie nowego projektu BigQuery.

Nazwij swój projekt. Przykładowo: „Ecommerce Report 2020”, dokładnie tak, jak poniżej.

Kliknij Create.

Przejdź do Billing, utwórz nowe konto rozliczeniowe i połącz swój nowo utworzony projekt BigQuery z tym kontem rozliczeniowym. Aby aktywować usługę, wpisz numer swojej karty kredytowej… I odbierz środki w wysokości 300 dolarów dla nowych użytkowników!

Teraz musisz założyć nowe konto serwisowe dla Stitch, aby połączyć się i wysłać dane do swojego projektu BigQuery.

Aby to zrobić, w konsoli GCP (Google Cloud Platform), wybierz zakładkę IAM & Admin po lewej stronie i kliknij ikonę “Konta Serwisowe”.


Na liście Service account wybierz opcję Create service account. Wprowadź nazwę w polu Service account name. Z listy Role, wybierz BigQuery > Admin.

Kliknij Create, a zobaczysz plik JSON, który zawiera Twój klucz do pobrania na komputer.

Otwórz Stitch.

Wgraj swój plik JSON do Stitch.

Wybierz Google Cloud Storage Location we Frankfurcie. 

Na koniec, wybierz charakterystykę ładowania. Możesz wybrać upsert lub append. Polecamy wybrać append.

Jeśli wszystko się udało, powinieneś zobaczyć komunikat, że Twój data pipeline został utworzony.

Wymaga to trochę czasu, by Twój data pipeline zaczął działać. W międzyczasie, na desce rozdzielczej zobaczysz status “oczekujący”.

Po pewnym czasie powinieneś zacząć widzieć niektóre dane w swoim raporcie.

Możesz zobaczyć, ile wierszy danych zostało zsynchronizowanych w tym okresie rozliczeniowym i kiedy pojawi się następny raport.

Kiedy już będziesz miał swoje dane w Google BigQuery, nadszedł czas, aby uzyskać cenny wgląd w transakcje i sprzedaż w handlu elektronicznym.

Uzyskiwanie wglądu w dane

Najpierw zapoznamy się z naszym zestawem danych BigQuery w Google Data Studio.

Aby to zrobić, należy otworzyć Data Studio i wybrać Blank Report. Pamiętaj, aby zalogować się do Data Studio pod taką samą nazwą, jaką użyłeś do rejestracji w BigQuery. W przeciwnym razie Data Studio nie będzie widzieć twoich tabel BigQuery.

Nazwij swoje Data Studio, na przykład BigQuery Deep Dive.

Kliknij Create new data source w raporcie BigQuery.

Wybierz BigQuery jako źródło danych.

Połącz się ze swoimi danymi.

Przejrzyj schemat i dodaj dane do swojego raportu.

Teraz możesz swobodnie korzystać z danych w swoim raporcie Data Studio!

Przy tak dużej ilości zmiennych kategorycznych, najszybszym sposobem na uzyskanie cennych spostrzeżeń byłoby użycie tabeli przestawnej i dodatkowe jej ubarwienie. To jest typ wykresu, którym będziemy się zajmować.

W tym celu należy kliknąć Add a chart i następnie wybrać Pivot table with heatmap . To dodaje podstawową tabelę przestawną do Twojego widoku głównego.

Dodaj wiersze, wymiary i metryki do tabeli przestawnej. Jeden z przykładów takiego działania znajduje się poniżej. Wykorzystaj możliwości i baw się!

Kliknij „View” i zobacz swój raport na żywo.

W raporcie końcowym łatwo zauważysz najlepszych użytkowników w naszych kategoriach: źródło/medium, kategorie urządzeń i miasta. Znaczeniem kolorystyczne znacznie ułatwia korzystanie z informacji.

Raport wizualny i analiza danych dają Ci dużo większą orientację w Twoich danych, ale to rozwiązanie ma pewne ograniczenia!

Zróbmy więc trochę dodatkowej konfiguracji naszych danych. Do tego potrzebujemy BigQuery i trochę kodu SQL.

Otwórz Google Cloud Console i BigQuery. Poniżej znajduje się widok, który powinieneś zobaczyć.

Uruchommy nasze pierwsze zapytanie. Chcemy zobaczyć, jaki jest skumulowany dochód w rozbiciu na wartości wymiarowe. Poniższy, super prosty skrypt SQL (jak w wersji BigQuery SQL) powinien się tutaj sprawdzić.

SELECT 
    acquisitionsourcemedium,
    city,
    devicecategory,
    SUM(transactionrevenue) as sumreve ,
FROM `analyticsbigquerytransactions.report`
GROUP BY acquisitionsourcemedium, city, devicecategory
ORDER BY sumreve desc

To zapytanie wykonało się błyskawicznie i ukazało następujące wyniki (widoczne są tylko trzy górne wiersze).

Co zrobić, jeśli chcemy sprawdzić średnią wielkości transakcji i ich wolumen we wszystkich naszych wymiarach? To powinno zadziałać.

SELECT 
    acquisitionsourcemedium,
    city,
    devicecategory,
    SUM(transactionrevenue) as sumreve ,
    SUM(transactions) as sumtrans,
    AVG(transactionrevenue) as avgreve
FROM `analyticsbigquerytransactions.report` 
GROUP BY acquisitionsourcemedium, city, devicecategory
ORDER BY sumreve desc

To tylko bardzo proste przykłady ilustrujące, że posiadanie danych w BigQuery ułatwia praca z nimi i pozwala na uzyskanie precyzyjniejszych informacji biznesowych.

Jedyne co musisz zrobić, aby utworzyć nową zmienną, to dodać odrobinę skryptu. Koniec z klikaniem bez końca wokół swoich raportów analitycznych. Prawdziwa wydajność.

Możemy również zapisać zapytanie na przyszłość, aby przyspieszyć generowanie spostrzeżeń.

Co więcej, można również zaplanować to zapytanie za pomocą interfejsu BigQuery. Zapytania zaplanowane korzystają z usługi przesyłania danych Google BigQuery. W ten sposób wystarczy raz na jakiś czas zalogować się i sprawdzić wynik swojego zapytania.

Swobodnie korzystaj z danych

Mamy nadzieję, że dobrze się bawiłeś, budując z nami swój data pipeline pomiędzy Google Analytics i Google BigQuery.

Chcieliśmy Ci pokazać, jak łatwo uwolnisz swoje dane z predefiniowanych raportów i przejdziesz na prawdziwie głęboki i kreatywny poziom. Tak uzyskasz przydatne interesujące spostrzeżenia.

Zachęcamy do eksperymentowania także z innymi sposobami maksymalnego wykorzystania danych przy użyciu takich narzędzi jak BigQuery.

To był bardzo prosty przykład. Możesz jednak wykorzystać wiedzę, której się nauczyłeś, aby zsynchronizować większe i głębsze zbiory danych i konfigurować znacznie bardziej wyrafinowane zapytania.

Jeśli potrzebujesz pomocy, napisz na adres mac@macmietek.com.

Możesz także dowiedzieć się więcej w zakładce About us.

Jeśli podoba Ci się ta treść i chcesz otrzymywać jeden nowy artykuł w tygodniu, zapisz się poniżej. Żadnego spamu.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *