Ga naar hoofdinhoud
GA4BIGQUERY

GA4 BigQuery export voor bureaus — setup + use cases.

Wanneer hou je op met GA4 rapporten en begin je met raw data? Complete gids over BigQuery-export: gratis tier, setup, kosten en concrete use cases.

GA4 heeft een fundamenteel nieuw feature ten opzichte van Universal Analytics: gratis BigQuery-export voor iedere property, tot 1 miljoen events per dag. Dat opent de deur naar cohort-analyse, attribution-reconstructie en machine learning die in de GA4-UI onmogelijk zijn.

Voor bureaus is dit geen feature voor specialisten meer. Zodra je klant 10.000+ sessies per dag draait, lopen de GA4-rapporten tegen sampling aan en worden attribution-modellen ongrijpbaar. BigQuery-export lost dat op — maar het vereist setup en begrip van de data-structuur.

De GA4→BigQuery pipeline in één zin.

GA4 streamt elk event (page_view, purchase, custom events) real-time naar een BigQuery-dataset in jouw Google Cloud project. Elke tabel is gepartitioneerd per dag; elke rij is één event met al zijn parameters. Geen aggregatie, geen sampling — 100% van de raw data.

Twee tabel-types:

  • events_intraday_YYYYMMDD — real-time stream van vandaag (events komen binnen minuten)
  • events_YYYYMMDD — daily tabel met alle events van die dag, klaar voor analyse (beschikbaar ~24u na dagmoment)

Hoeveel kost het?

Voor de meeste bureau-klanten is dit écht gratis:

  • BigQuery storage: 10GB gratis per maand. GA4-data voor een website met 100K sessies per maand is typisch ~500MB-2GB. Tot ~5 klanten op één project = gratis.
  • BigQuery queries: 1TB gratis per maand. Tenzij je dagelijks full-table scans draait, blijf je onder de limiet.
  • GA4 export zelf: gratis (was betaalde feature voor GA360, maar sinds GA4 standaard).
  • Kosten buiten gratis tier: $0.02/GB storage, $5/TB queries. Bij 20+ klanten met flinke traffic: reken op $10-30/maand.

Het limiet dat je wél kan raken: 1 miljoen events per dag per property. Boven die limiet moet je betalen voor het export-volume. Grote e-commerce sites kunnen hier tegenaan lopen.

Van GA4-property naar SELECT-queries.

  1. Maak een Google Cloud project (of gebruik bestaande). Je hebt billing-account nodig, maar voor gratis tier wordt niks afgeschreven. Enable BigQuery API.
  2. GA4 Admin → Product links → BigQuery Links → Link. Kies je cloud project, kies de data-set location (EU-west, kies Europe-west1 voor GDPR). Kies Daily én Streaming als je real-time queries wilt.
  3. Event filters optioneel — standaard alle events exporteren, maar je kunt page_view's van staging-environments uitsluiten via _env parameter-filtering.
  4. Wacht 24 uur voor de eerste daily tabel. events_intraday_* tabellen verschijnen binnen een uur.
  5. Test query: SELECT event_name, COUNT(*) FROM `project.dataset.events_*` WHERE _TABLE_SUFFIX BETWEEN '20260101' AND '20260131' GROUP BY 1 ORDER BY 2 DESC

Voor één klant neemt setup 15-30 min. Voor een portfolio van 20 klanten heb je automation nodig (Signum Core deployt BigQuery-links via de GA4 Admin API — zie looker-studio-automation).

Wat kun je doen dat GA4 niet kan?

[USE CASE 1]

COHORT-ANALYSE

Retentie van users die in januari een eerste purchase deden — hoe vaak komen ze terug in maand 2, 3, 6? GA4-UI limiteert cohort-analyse tot 12 weken; BigQuery kan elke periode.

[USE CASE 2]

ATTRIBUTION RECONSTRUCTIE

Bouw je eigen attribution-model op raw touchpoint-data. Markov-chain, Shapley-values of custom business-rules — niet beperkt tot GA4's data-driven model.

[USE CASE 3]

ML + PREDICTIVE

BigQuery ML of externe notebooks (Vertex AI, Colab) voor churn-prediction, LTV-voorspelling, next-best-action. Export naar CSV/parquet voor Python/R workflows.

Waar lopen bureaus tegenaan?

  • Data-schema leercurve. Events zijn genest: event_params is een ARRAY van STRUCTs. Query's vereisen UNNEST() om parameters plat te slaan. De eerste weken is dit onwennig; na 10 queries zit het in je vingers.
  • Timezone-verwarring. GA4-events worden gelogd in UTC. Je klant's property kan in CET staan. Altijd TIMESTAMP_MICROS(event_timestamp) omzetten naar de relevante timezone voordat je rapporteert.
  • User_id vs user_pseudo_id. user_pseudo_id is altijd gevuld (cookie-based). user_id alleen als je klant expliciet identifies pushed. Bij joining van sessies: begin met user_pseudo_id tenzij je zeker weet dat user_id overal gezet is.
  • Export-delay bij batch-heavy sites. Sommige sites pushen events in bursts (newsletter-send, deploy-notificaties). GA4-export kan dan 2-6 uur achterlopen in plaats van 1. Plan dashboards daarom rond 09:00 lokale tijd, niet middernacht.

Moet elke klant export hebben?

Wel zinvol voor:

  • → Klanten met 50K+ sessies/maand — rapporten krijgen anders sampling-issues
  • → E-commerce met ambitieuze attribution-vragen
  • → Klanten die ML/data-science willen doen (of al partners hebben die dat doen)
  • → Bureaus die custom dashboards in Looker Studio bouwen — BigQuery als bron ipv GA4-native

Niet zinvol voor:

  • → Lokale bedrijven met <5K sessies/maand (GA4-UI is voldoende)
  • → Klanten zonder technische capaciteit om queries te draaien
  • → Sites zonder paid-media budget (minder attribution-urgentie)

Samenvatting.

  1. GA4 exporteert sinds 2022 raw event-data gratis naar BigQuery (tot 1M events/dag).
  2. Storage + queries blijven meestal binnen de 10GB + 1TB gratis tier.
  3. Setup: GA4 Admin → BigQuery Links → Link, 15-30 min per klant.
  4. Use cases: lange-termijn cohort-analyse, custom attribution, ML, non-sampled dashboards.
  5. Zinvol vanaf ~50K sessies/maand of bij serieuze data-science vragen. Daaronder: GA4-UI is prima.
  6. Bureaus die 20+ klanten beheren, kunnen BigQuery-links automatiseren via de GA4 Admin API.

// NIEUWSBRIEF

Stuur me toekomstige artikelen.

Eén mail per maand over tracking operations — nieuwe artikelen, updates over het product, bureau-lessen. Uitschrijven kan altijd.

Geen spam. Uitschrijven kan altijd via elke mail.

// READY?

BigQuery-links automatisch per klant?

Signum Core maakt GA4→BigQuery-links aan via de Admin API en beheert ze per klantportfolio.