Metodologia CrUX

Esta seção documenta como o CrUX coleta e organiza os dados de experiência do usuário.

Qualificação

No centro do conjunto de dados do CrUX estão as experiências individuais do usuário, que são agregadas em distribuições no nível da página e da origem. Esta seção documenta a qualificação do usuário e os requisitos para que páginas e origens sejam incluídas no conjunto de dados. Todos os critérios de qualificação precisam ser atendidos para que uma experiência seja incluída nos dados no nível da página disponíveis no PageSpeed Insights e na API CrUX: User, Origin e Page. As experiências que atendem aos critérios de usuário e origem, mas não de página, não são incluídas nos dados no nível da origem disponíveis em todas as fontes de dados do CrUX.

As páginas e origens serão incluídas ou removidas automaticamente do conjunto de dados se a qualificação mudar ao longo do tempo. No momento, não é possível enviar páginas ou origens manualmente para inclusão.

Aparece publicamente

Uma página precisa ser publicamente detectável para ser considerada para inclusão no conjunto de dados do CrUX.

Uma página é considerada publicamente detectável usando os mesmos critérios de indexabilidade que os mecanismos de pesquisa.

Uma página não pode atender ao requisito de detecção se qualquer uma das condições a seguir for atendida, incluindo as páginas raiz para o conjunto de dados de origem:

  • A página é exibida com um código de status HTTP diferente de 200 (após os redirecionamentos).
  • A página é exibida com um cabeçalho HTTP X-Robots-Tag: noindex ou equivalente.
  • O documento inclui uma metatag <meta name="robots" content="noindex"> ou equivalente.

Consulte o Google Search Console para ter uma visão geral do status de indexação do site.

Popular o suficiente

Uma página é considerada suficientemente popular se tiver um número mínimo de visitantes. Uma origem é considerada suficientemente popular se tiver um número mínimo de visitantes em todas as páginas. Um número exato não é divulgado, mas foi escolhido para garantir que tenhamos amostras suficientes para confiar nas distribuições estatísticas das páginas incluídas. O número mínimo é o mesmo para páginas e origens.

As páginas e origens que não atendem ao limite de popularidade não são incluídas no conjunto de dados do CrUX.

Origem

Uma origem representa um site inteiro, endereçável por um URL como https://www.example.com. Para que uma origem seja incluída no conjunto de dados CrUX, ela precisa atender a dois requisitos:

  1. Pode ser descoberto publicamente
  2. Em alta

É possível verificar se a origem pode ser detectada executando uma auditoria do Lighthouse e analisando os resultados da categoria de SEO. O site não será detectável se a página raiz falhar nas auditorias A página está bloqueada para indexação ou A página não teve êxito no código de status HTTP.

Se for determinado que uma origem pode ser descoberta publicamente, as experiências do usuário qualificadas em todas as páginas dessa origem serão agregadas no nível da origem, independentemente da detecção de cada página. Todas essas experiências contam para o requisito de popularidade da origem.

Para fins de consulta, observe que todas as origens no conjunto de dados do CrUX estão em letras minúsculas.

página;

Os requisitos para que uma página seja incluída no conjunto de dados do CrUX são os mesmos das origens:

  1. Pode ser descoberto publicamente
  2. Em alta

É possível verificar se uma página é detectável executando uma auditoria do Lighthouse e analisando os resultados da categoria de SEO. A página não será detectável se for reprovada nas auditorias A página está bloqueada para indexação ou A página não teve êxito no código de status HTTP.

Se a página puder ser descoberta publicamente para alguns usuários, mas retornar um status HTTP de falha em algumas circunstâncias, essas experiências não serão incluídas no CrUX.

Geralmente, as páginas têm identificadores adicionais no URL, incluindo parâmetros de string de consulta como ?utm_medium=email e fragmentos como #main. Esses identificadores são removidos do URL no conjunto de dados CrUX para que todas as experiências do usuário na página sejam agregadas. Isso é útil para páginas que não atenderiam ao limite de popularidade se houvesse muitas variações de URL desconexas para a mesma página. Em casos raros, isso pode agrupar inesperadamente experiências de páginas distintas. Por exemplo, se os parâmetros ?productID=101 e ?productID=102 representarem páginas diferentes.

As páginas no CrUX são medidas com base na página de nível superior. As páginas incluídas como iframes não são informadas separadamente no CrUX, mas contribuem para as métricas da página de nível superior. Por exemplo, se https://www.example.com/page.html incorporar https://www.example.com/frame.html a um iframe, page.html será representado no CrUX (sujeito a outros critérios de qualificação), mas frame.html não. Se o frame.html tiver uma CLS ruim, ele vai ser incluído ao medir a CLS para page.html. O CrUX é o Chrome User Experience Report, e o usuário pode nem saber que se trata de um iframe. Portanto, a experiência é medida na página de nível superior, de acordo com a maneira como o usuário vê isso.

A arquitetura de um site pode complicar a forma como os dados são representados no CrUX. Por exemplo, os apps de página única (SPAs) podem usar um esquema de transição de rota baseado em JavaScript para alternar entre as páginas, em vez das navegações convencionais baseadas em âncoras. Essas transições aparecem como novas visualizações de página para o usuário. No entanto, no Chrome e nas APIs da plataforma subjacentes, toda a experiência é atribuída à visualização de página inicial. Essa é uma limitação das APIs da plataforma da Web em que o CrUX é criado. Consulte Como as arquiteturas de SPA afetam as Core Web Vitals (link em inglês) em web.dev para saber mais.

Usuário

Para que as experiências de um usuário sejam agregadas no conjunto de dados do CrUX, ele precisa atender aos seguintes critérios:

  1. Ative os relatórios de estatísticas de uso.
  2. sincronizar o histórico do navegador.
  3. não ter uma senha longa de sincronização definida;
  4. Use uma plataforma compatível.

Estas são as plataformas compatíveis no momento:

  • Versões para computador do Chrome, incluindo os sistemas operacionais Windows, macOS, ChromeOS e Linux.
  • Versões Android do Chrome, incluindo apps para dispositivos móveis que usam guias personalizadas e WebAPKs.

Há algumas exceções notáveis que não fornecem dados para o conjunto de dados do CrUX:

  • Chrome no iOS.
  • Apps Android que usam a WebView.
  • outros navegadores Chromium (por exemplo, Microsoft Edge);

O Chrome não publica dados sobre as proporções de usuários que atendem a esses critérios. Saiba mais sobre os dados que coletamos no Artigo de Privacidade do Chrome.

Accelerated Mobile Pages (AMP)

As páginas criadas com AMP são incluídas no conjunto de dados CrUX como qualquer outra página da Web. A partir da versão do CrUX de junho de 2020, as páginas veiculadas com o cache de AMP e / ou renderizadas no visualizador de AMP também serão capturadas e atribuídas ao URL da página do editor.

Qualidade dos dados

Os dados no CrUX passam por uma pequena quantidade de processamento para garantir que sejam estatisticamente precisos, bem estruturados e mais fáceis de consultar.

Filtragem

O conjunto de dados CrUX é filtrado para garantir que os dados apresentados sejam estatisticamente válidos. Isso pode impedir que páginas ou origens inteiras apareçam no conjunto de dados.

Além dos critérios de qualificação aplicados a origens e páginas, mais filtros são aplicados para segmentos nos dados:

Origens ou páginas com mais de 20% do tráfego total excluído devido a combinações de dimensões não qualificadas são totalmente excluídas do conjunto de dados.

Como o conjunto de dados de nível global abrange as experiências do usuário de todos os países, as combinações de dimensões que não atendem aos critérios de popularidade no nível do país ainda podem ser incluídas no nível global, desde que haja popularidade suficiente.

Fuzzing

Uma pequena quantidade de aleatoriedade é aplicada ao conjunto de dados para evitar a engenharia reversa de dados sensíveis, como volumes totais de tráfego. Isso não afeta a precisão das estatísticas agregadas.

Precisão

A maioria dos valores de métricas no conjunto de dados CrUX é representada como histogramas de valores e tamanhos de agrupamento, em que o valor do histograma é uma fração de todos os segmentos incluídos somando 1. Os tamanhos de agrupamento são números de ponto flutuante entre 1,0 e 0,0001.

As larguras dos agrupamentos do histograma são normalizadas para simplificar a consulta e a visualização dos dados. Isso significa que agrupamentos maiores podem ser divididos em agrupamentos menores, que compartilham igualmente a densidade original para manter as larguras consistentes.

Licença

Os conjuntos de dados CrUX do Google são licenciados nos termos da Licença internacional de Atribuição 4.0 da Creative Commons.