Kde jste: Hlavní stránkaGoogle Analytics přestávají u hodně navštěvovaných webů zobrazovat údaje a dokonce i počítat konverze

Google Analytics přestávají u hodně navštěvovaných webů zobrazovat údaje a dokonce i počítat konverze

Vydáno v blogu Digitální analytika, CRO a UX, Google Analytics

Také se vám již stalo, že jste v Google Analytics potřebovali zjistit hodnoty některých parametrů, ale jako nejčastější ukazatel jste viděli (other)? Co to znamená a jaká je příčina?

Jelikož je software Google Analytics zdarma, lze od něj očekávat jistá omezení v objemu skladovaných dat. Sám Google uvádí na svých oficiálních stránkách, že služba Google Analytics je poskytována zdarma do pěti milionů pageviews měsíčně, následně musíte investovat alespoň jeden dolar (respektive ekvivalent) denně do AdWords.

Další striktní omezení se týká informací o provozu na vašem webu. Zde je limit nastaven na 50 000 unikátních URL denně. Google říká, že sbírá data o celém webu, ale zobrazuje informace pouze o 50 000 nejnavštěvovanějších stránkách za den (počítáno podle PageViews). To v přehledu Obsah odpovídá 50 000 řádků v tabulce. Tabulka dokáže uchovávat údaje pouze prvních padesáti tisíc řádků. Údaje ze všech dalších řádků jsou již agregovány. U placené verze Urchin je pak objem dat limitován na 100 000 unikátních záznamů za měsíc, objem však lze snadným zásahem zdarma zvýšit až na půl milionu.

Maximálně 20 000/50 000 záznamů – URL, klíčových slov, nejnavštěvovanějších stránek atd.

Limit 50 000 záznamů za den neplatí jenom na URL, ale např. i na klíčová slova a všechny další záznamy. Google neříká, jak je databáze veliká pro jednotlivé typy záznamů. U URL říká, že jde o 50 000 záznamů za den. Někteří uživatelé ale reportují, že již nejsou schopni zobrazovat záznamy, je-li jich více jak 20 000, protože Google nedávno snížil hranici na 20 000 záznamů (další report zde, zde nebo zde).

A nebudou se vám počítat konverze

Problémem u webů a zvláště e-shopů s vysokou návštěvností může být počítání konverzí. Řekněme, že pro každou konverzi je vytvořena zvláštní URL. Tato URL bude mít samozřejmě většinou jediné zhlédnutí a vygeneruje-li váš web více jak 50 000 URL za den, tato URL se pravděpodobně nezapočítají – a vám se nezapočítají konverze.

Google Analytics doporučují vytvořit speciální profil pro stránky s nízkou návštěvností, což je ale dosti krkolomné. Lepším řešením je v Upravit údaje o profilu napsat do pole Vyloučit parametry v URL ty parametry, které chcete vyloučit (např. sessionid). A jak dále poznamenává Roman Appeltauer na Romag.cz, je vhodné i v Hledání na stránkách zapnout odřezávání parametru s dotazem z URL. Nicméně toto řešení není jednoduché a nemusí problém vyřešit.

Nejčistší řešení je samozřejmě použít jiný analytický software jako je Coremetrics Analytics nebo Adobe/Omniture SiteCatalyst.

Pro lepší představu lze tato omezení zhruba převést na počty návštěvníků, kteří na váš web přišli během jednoho dne. Záleží samozřejmě, jak rozsáhlý je váš web, kolik má URL a jak jsou tvořena. Shailendra Dubey uvádí, že u placené verze Google Analytics – Urchinu, který má limit 100 000 záznamů denně, se údaje přestávají zobrazovat na webech s návštěvností vyšší než 75 000 návštěv za den.

U neplacené verzi Google Analytics samozřejmě záleží, jak je web vytvořen a používán (např. jak se vytváří URL, kolik z nich je statických, přes kolik klíčových slov se na web přistupuje atd.). Obecně je ale za horní strop efektivního nasazení považováno cca 40 000 návštěv/den.

Jak vypadají agregované údaje v Google Analytics?

Pokud v konkrétním přehledu uvidíte na některém řádku (other), u kterého bude číselný údaj, pak vám tento řádek říká, že se jedná o agregovaný údaj dat, které Google Analytics nedokáže uchovat.

Níže vidíte report jednoho klienta naší internetové reklamní agentury týkající se přístupu přes klíčová slova. Dostali jsme report, kde byl na prvním místě údaj (other) s 5 042 304 návštěvami. Jinými slovy, návštěvnost webu je natolik vysoká, že Google Analytics dokáže skladovat údaje pouze u zlomku klíčových slov, všechna další klíčová slova agreguje jako (other). Report s klíčovými slovy je tedy vážně znečištěn a nedokážeme přesně říci, přes jaká klíčová slova na web klienta chodí nejvíce návštěv (první místo je celkem jisté, ale u zbytku to již jisté není, nemluvě o tom, kdybychom chtěli klíčová slova clusterovat).

 

Zdroj: Google Analytics, Zdroje návštěvnosti – Klíčová slova

Při jakých objemech záznamů přestávají Google Analytics poskytovat údaje?

Připomeňme si, že pokud se vám začíná zobrazovat (other), Google Analytics již nezobrazuje údaje. Oficiálně Google hovoří jenom o 50 000 URL za den. Dělali jsme v naší internetové reklamní agentuře RobertNemec.com pokusy a zjistili jsme následující:

  1. závisí na typu záznamu – nejnáchylnější jsou URL/stránky podle názvu a klíčová slova, nejméně náchylné, podle toho, na co jsme narazili, jsou Domény ve Vlastnostech sítě (u jednoho webu se nám podařilo zobrazit 499 000 domén),
  2. záleží na struktuře záznamu – domníváme se, že se používají regulární výrazy, které šetří místo v databázi. Je-li možno záznamy zkrátit, pravděpodobně se jich pak vejde do vyhrazeného prostoru více,
  3. závisí na délce zvoleného období – u krátkého období může jít o několik procent, u delšího je nedostupných i 50 % údajů (sic!),
  4. závisí na typu webu – pravděpodobně může jít o množství údajů ukládaných v daném profilu.

Přesný počet údajů daného typu, od kdy začínají být údaje dostupné, je stále trochu záhadou. Někde se nám nikdy nechce zobrazit více jak 1 000 000 záznamů (např. všechny zdroje provozu – jakoby neexistovalo více jak 1 000 000 záznamů – přitom víme, že jich je více) a (other) tvoří jenom několik procent. V jiných případech (jiný profil/web/metrika/časové období) jsme na nižším počtu záznamů a (other) tvoří 40 % z počtu údajů (údaji myslím počet návštěv přes klíčová slova). Pak můžete jenom spekulovat, proč tomu tak je.

Mimochodem, chceme-li zobrazit nejnavštěvovanější stránky za delší časové období (např. měsíce) u hodně navštěvovaných webů (stovky tisíc návštěv denně), hlásí už Google Analytics jenom: Při stahování dat pro toto zobrazení došlo k chybě.

Hodí se Google Analytics pro velmi navštěvované weby?

Odpověď je snadná: nehodí. Údaje mohou být zkreslené o desítky procent až polovinu, navíc je zde problém s počítáním konverzí.

Jako první rychlé řešení doporučujeme vždy nainstalovat bezplatný Piwik. Ostatně, i když máte např. jenom desítky tisíc návštěv denně, nainstalujte si Piwik a porovnejte rozdíl (každý má samozřejmě jinou metodiku sběru dat a jejich vyhodnocování, ale pro kontrolu a srovnání postačí).

A chcete-li přesnější měření, stačí vybrat něco z trojice Adobe/Omniture SiteCatalyst, Coremetrics Analytics nebo WebTrends.

Doporučte tento článek přátelům Nechte si zasílat čtrnáctidenní přehled našich článků na e-mail
Odebírejte newsletter:

Přečtěte si další články k tématu

Komentáře

  1. a co by sa stalo kebyze pouzijem setSampleRate v Analytics?

  2. Klára Boháčková napsal:

    Dobrý den,použitím setSampleRate nastavíte procento unikátních návštěvníků, kteří se budou sbírat do přehledů. Např. sample rate 25 % říká, že se budou sbírat data každého čtvrtého unik. návštěvníka.U hodně navštěvovaných webů pak hrozí, že sample rate musíte nastavit na velmi nízkou hodnotu. Díky tomu vám pak z přehledu vypadne vysoké procento dat s hodnotami, které pro vás mohou být klíčové.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>