CrUX-Methodik

In diesem Abschnitt wird dokumentiert, wie CrUX Daten zur Nutzererfahrung erfasst und organisiert.

Voraussetzungen

Den Kern des CrUX-Datasets bilden individuelle Nutzererfahrungen, die in Verteilungen auf Seitenebene und auf Ursprungsebene zusammengefasst sind. In diesem Abschnitt werden die Teilnahmevoraussetzungen für Nutzer und die Anforderungen an Seiten und Ursprünge dokumentiert, die in das Dataset aufgenommen werden sollen. Alle Voraussetzungen müssen erfüllt sein, damit eine Websitevariante in Daten auf Seitenebene aufgenommen werden kann, die in PageSpeed Insights und der CrUX API verfügbar sind: Nutzer, Ursprung und Seite. Erfahrungen, die die Kriterien „Nutzer“ und „Ursprung“ erfüllen, aber nicht die Seite „Seite“, sind nicht in den Daten auf Ursprungsebene enthalten, die in allen CrUX-Datenquellen verfügbar sind.

Seiten und Ursprünge werden automatisch in das Dataset aufgenommen oder daraus entfernt, wenn sich ihre Voraussetzungen im Laufe der Zeit ändern. Derzeit ist es nicht möglich, Seiten oder Ursprünge manuell zur Aufnahme einzureichen.

Öffentlich sichtbar

Eine Seite muss öffentlich sichtbar sein, damit sie in das CrUX-Dataset aufgenommen werden kann.

Eine Seite wird anhand derselben Indexierbarkeit wie Suchmaschinen als öffentlich auffindbar eingestuft.

Eine Seite kann die Sichtbarkeitsanforderung nicht erfüllen, wenn eine der folgenden Bedingungen erfüllt ist, einschließlich der Stammseiten für das Ursprungs-Dataset:

  • Die Seite wird mit einem anderen HTTP-Statuscode als 200 (nach Weiterleitungen) bereitgestellt.
  • Die Seite wird mit einem HTTP-X-Robots-Tag: noindex-Header oder einem gleichwertigen Header bereitgestellt.
  • Das Dokument enthält ein <meta name="robots" content="noindex">-Meta-Tag oder ein gleichwertiges Tag.

Eine Übersicht über den Indexierungsstatus deiner Website findest du in der Google Search Console.

Ausreichend beliebt

Eine Seite gilt als ausreichend beliebt, wenn sie eine Mindestanzahl von Besuchern hat. Ein Ursprung wird als ausreichend beliebt eingestuft, wenn er auf allen Seiten eine Mindestanzahl von Besuchern hat. Eine genaue Zahl wird nicht angegeben, aber sie wurde ausgewählt, um sicherzustellen, dass genügend Stichproben vorhanden sind, um die statistischen Verteilungen für die enthaltenen Seiten mit Gewissheit zu gewährleisten. Die Mindestanzahl ist für Seiten und Ursprünge gleich.

Seiten und Ursprünge, die den Schwellenwert für die Beliebtheit nicht erreichen, sind nicht im CrUX-Dataset enthalten.

Ursprung

Ein Ursprung steht für eine ganze Website, die über eine URL wie https://www.example.com adressiert werden kann. Damit ein Ursprung in das CrUX-Dataset aufgenommen werden kann, muss er zwei Anforderungen erfüllen:

  1. Öffentlich sichtbar
  2. Sehr beliebt

Mit einem Lighthouse-Audit und den Ergebnissen der SEO-Kategorie können Sie prüfen, ob Ihr Ursprung auffindbar ist. Ihre Website ist nicht sichtbar, wenn Ihre Stammseite die Prüfung Seite ist für Indexierung blockiert oder Seite hat nicht erfolgreiche HTTP-Statuscodes nicht bestanden hat.

Wenn festgestellt wird, dass ein Ursprung öffentlich sichtbar ist, werden infrage kommende Nutzererfahrungen auf allen Seiten dieses Ursprungs auf Ursprungsebene zusammengefasst, unabhängig von der Sichtbarkeit der einzelnen Seiten. Alle diese Erfahrungen werden auf die Beliebtheitsanforderung des Ursprungs angerechnet.

Beachten Sie bei Abfragen, dass alle Ursprünge im CrUX-Dataset in Kleinbuchstaben geschrieben werden.

Seite

Eine Seite, die in das CrUX-Dataset aufgenommen wird, muss dieselben Anforderungen erfüllen wie Ursprünge:

  1. Öffentlich sichtbar
  2. Sehr beliebt

Wenn Sie prüfen möchten, ob eine Seite gefunden werden kann, führen Sie einen Lighthouse-Audit durch und sehen Sie sich die Ergebnisse der Kategorie „SEO“ an. Ihre Seite ist nicht auffindbar, wenn sie die Prüfung Seite ist für Indexierung blockiert oder Seite hat nicht erfolgreiche HTTP-Statuscodes nicht bestanden hat.

Wenn die Seite für einige Nutzer öffentlich sichtbar ist, unter bestimmten Umständen aber der HTTP-Status „Nicht erfolgreich“ zurückgegeben wird, werden diese Websitevarianten nicht in die Nutzererfahrung in Chrome aufgenommen.

Seiten haben in der Regel zusätzliche Kennungen in ihrer URL, darunter Abfragestringparameter wie ?utm_medium=email und Fragmente wie #main. Diese Kennungen werden aus der URL im CrUX-Datensatz entfernt, sodass alle Nutzererfahrungen auf der Seite zusammengefasst werden. Dies ist nützlich für Seiten, die den Grenzwert für die Beliebtheit nicht erreichen würden, wenn es für dieselbe Seite viele unzusammenhängende URL-Varianten gäbe. In seltenen Fällen können dadurch Tests für verschiedene Seiten unerwartet gruppiert werden, z. B. wenn die Parameter ?productID=101 und ?productID=102 für unterschiedliche Seiten stehen.

Seiten in der Nutzererfahrung in Chrome werden basierend auf der Seite der obersten Ebene gemessen. Als iFrames eingefügte Seiten werden in CrUX-Berichten nicht separat aufgeführt, sie werden aber zu den Messwerten für die Seite auf oberster Ebene beigetragen. Wenn https://www.example.com/page.html beispielsweise https://www.example.com/frame.html in einen iFrame einbettet, wird page.html in CrUX repräsentiert (vorbehaltlich der anderen Teilnahmevoraussetzungen), frame.html jedoch nicht. Und wenn frame.html einen schlechten CLS-Wert hat, wird der CLS beim Messen der CLS für page.html berücksichtigt. CrUX ist der Bericht zur Nutzererfahrung in Chrome, bei dem Nutzern möglicherweise nicht einmal bewusst ist, dass es sich um einen iFrame handelt. Die Nutzererfahrung wird daher auf der Seite auf oberster Ebene gemessen, je nachdem, wie der Nutzer dies sieht.

Die Darstellung der Daten in CrUX kann durch die Architektur einer Website erschwert werden. Beispielsweise können Single-Page-Anwendungen (SPAs) ein JavaScript-basiertes Schema für den Routenübergang verwenden, um zwischen Seiten zu wechseln. Dies ist anders als bei herkömmlichen, verankerten Seitennavigationen. Diese Übergänge werden dem Nutzer als neue Seitenaufrufe angezeigt, aber für Chrome und die zugrunde liegenden Plattform-APIs wird die gesamte Darstellung dem anfänglichen Seitenaufruf zugeordnet. Dies ist eine Einschränkung der Webplattform-APIs, auf denen CrUX basiert.Weitere Informationen finden Sie unter So wirken sich SPA-Architekturen auf Core Web Vitals aus.

Nutzer

Damit die Erfahrungen eines Nutzers im CrUX-Dataset zusammengefasst werden können, müssen er die folgenden Kriterien erfüllen:

  1. Berichterstellung mit Nutzungsstatistiken aktivieren
  2. den Browserverlauf synchronisieren.
  3. Sie haben keine Passphrase für die Synchronisierung festgelegt.
  4. Verwenden Sie eine unterstützte Plattform.

Derzeit werden folgende Plattformen unterstützt:

  • Desktopversionen von Chrome, einschließlich der Betriebssysteme Windows, macOS, ChromeOS und Linux
  • Android-Versionen von Chrome, einschließlich mobiler Apps mit benutzerdefinierten Tabs und WebAPKs

Es gibt einige wichtige Ausnahmen, die keine Daten für das CrUX-Dataset liefern:

  • Chrome unter iOS.
  • Android-Apps, die WebView verwenden
  • Andere Chromium-Browser (z. B. Microsoft Edge)

Chrome veröffentlicht keine Daten über die Anteile von Nutzern, die diese Kriterien erfüllen. Weitere Informationen zu den von uns erhobenen Daten finden Sie im Whitepaper zum Datenschutz bei Chrome.

Accelerated Mobile Pages (AMP)

Mit AMP erstellte Seiten werden wie jede andere Webseite in den CrUX-Datensatz aufgenommen. Seit dem CrUX-Release vom Juni 2020 werden Seiten, die mit dem AMP-Cache bereitgestellt und / oder im AMP-Viewer gerendert werden, ebenfalls erfasst und der Seiten-URL des Publishers zugeordnet.

Datenqualität

Die Daten in CrUX werden in geringem Umfang verarbeitet, damit sie statistisch präzise, gut strukturiert und leichter abgefragt werden können.

Wird gefiltert

Der CrUX-Datensatz wird gefiltert, um sicherzustellen, dass die dargestellten Daten statistisch gültig sind. Dadurch werden möglicherweise ganze Seiten oder Ursprünge aus dem Datensatz ausgeschlossen.

Zusätzlich zu den Eignungskriterien für Ursprünge und Seiten werden weitere Filter auf Segmente in den Daten angewendet:

Ursprünge oder Seiten, bei denen mehr als 20% der Gesamtzugriffe aufgrund unzulässiger Kombinationen von Dimensionen ausgeschlossen sind, werden vollständig aus dem Datensatz ausgeschlossen.

Da der Datensatz auf globaler Ebene Nutzererfahrungen aus allen Ländern umfasst, können Kombinationen von Dimensionen, die die Beliebtheitskriterien auf Länderebene nicht erfüllen, trotzdem auf globaler Ebene einbezogen werden, sofern die Beliebtheit ausreichend ist.

Fuzzing

Auf das Dataset wird ein wenig Zufälligkeit angewendet, um ein Reverse Engineering sensibler Daten, wie z. B. das gesamte Trafficvolumen, zu verhindern. Dies hat keinen Einfluss auf die Genauigkeit der zusammengefassten Statistiken.

Precision

Die meisten Messwerte im CrUX-Dataset werden als Histogramme von Werten und Bin-Größen dargestellt, wobei der Histogrammwert ein Bruchteil aller enthaltenen Segmente ist, dessen Summe 1 ergibt. Klassengrößen sind Gleitkommazahlen zwischen 1,0 und 0,0001.

Die Bin-Breiten des Histogramms werden normalisiert, um die Abfrage und Visualisierung der Daten zu vereinfachen. Das bedeutet, dass größere Container in kleinere Klassen aufgeteilt werden können, die dieselbe ursprüngliche Dichte aufweisen, damit die Klassenbreite gleich bleibt.

Lizenz

CrUX-Datensätze von Google unterliegen der Creative-Commons-Lizenz „Namensnennung 4.0 International“.