CrUX の手法

このセクションでは、CrUX がどのようにユーザー エクスペリエンス データを収集、整理するかについて説明します。

利用資格

CrUX データセットの中核は個々のユーザー エクスペリエンスであり、ページレベルとオリジン レベルの分布に集約されます。このセクションでは、ユーザーの利用資格と、データセットに含めるページとオリジンの要件について説明します。PageSpeed Insights と CrUX API で利用できるページレベルのデータにエクスペリエンスを含めるには、ユーザーオリジンページのすべての利用条件を満たす必要があります。ユーザー条件とオリジンの条件は満たしているものの、「ページ」の条件は満たしていないエクスペリエンスは、すべての CrUX データソースで利用可能なオリジンレベルのデータに含まれません。

ページとオリジンは、時間の経過とともに利用資格が変わる場合、自動的にデータセットに含まれるか、データセットから削除されます。現時点では、登録するページやオリジンを手動で送信することはできません。

一般公開

CrUX データセットに含まれると見なされるには、ページが一般公開されている必要があります。

ページは、検索エンジンと同じインデックス登録可能性基準を使用して一般公開されていると判断されます。

次のいずれかの条件(元のデータセットのルートページを含む)が満たされている場合、ページは検出可能性の要件を満たしません。

  • ページが(リダイレクト後に)200 以外の HTTP ステータス コードで配信されている。
  • ページが HTTP X-Robots-Tag: noindex ヘッダー(または同等のもの)で配信される。
  • <meta name="robots" content="noindex"> メタタグまたは同等の内容がドキュメントに含まれている。

サイトのインデックス登録ステータスの概要については、Google Search Console をご覧ください。

十分な人気

訪問者数が一定数に達しているページは、十分に人気があると判断されます。オリジンは、すべてのページで訪問者数が最も少ない場合に、十分に人気があると判断されます。正確な数は開示されていませんが、含まれるページの統計的分布に確信を持てる十分なサンプルを確保するよう選択されています。最小数はページとオリジンで同じです。

人気度のしきい値を満たしていないページとオリジンは、CrUX データセットに含まれません。

出発地

オリジンはウェブサイト全体を表し、https://www.example.com などの URL で指定できます。オリジンを CrUX データセットに含めるには、次の 2 つの要件を満たす必要があります。

  1. 一般公開可能
  2. 十分に人気がある

オリジンが検出可能かどうかは、Lighthouse 監査を実行して SEO カテゴリの結果を確認することで確認できます。ルートページがページのインデックス登録がブロックされています、またはページの HTTP ステータス コードに失敗していますの監査で不合格だった場合、サイトは検出できません。

オリジンが一般公開されていると判定された場合、個々のページの検出可能性に関係なく、そのオリジンのすべてのページで適切なユーザー エクスペリエンスがオリジンレベルで集計されます。これらのエクスペリエンスはすべて、オリジンの人気度の要件にカウントされます。

クエリの目的のため、CrUX データセットのオリジンはすべて小文字であることに注意してください。

ページング

ページが CrUX データセットに含まれるための要件は、オリジンと同じです。

  1. 一般公開可能
  2. 十分に人気がある

ページが検出可能かどうかを確認するには、Lighthouse 監査を実行して、SEO カテゴリの結果を確認します。ページのインデックス登録がブロックされています、またはページの HTTP ステータス コードに失敗していますの監査で不合格だった場合、ページは検出できません。

一部のユーザーに対して一般公開されているページでも、状況によっては不成功の HTTP ステータスを返す場合、そのようなエクスペリエンスは CrUX には含まれません。

通常、ページの URL には、?utm_medium=email などのクエリ文字列パラメータや #main などのフラグメントなど、追加の識別子が含まれます。これらの識別子は CrUX データセットの URL から削除され、ページ上のすべてのユーザー エクスペリエンスが集約されます。この方法は、同じページにまとまりのない URL のバリエーションが多くあるため、他の方法では人気度のしきい値に達しないページで利用できます。まれに、個別のページのエクスペリエンスが予期せずグループ化されることがあります(パラメータ ?productID=101?productID=102 が異なるページを表す場合など)。

CrUX のページは、最上位のページを基準に測定されます。iframe として挿入されたページは、CrUX では個別にレポートされませんが、最上位のページの指標には寄与します。たとえば、https://www.example.com/page.html で iframe に https://www.example.com/frame.html が埋め込まれている場合、page.html は CrUX で表されます(他の利用条件が適用されます)が、frame.html表示されません。また、frame.htmlCLS が不十分な場合は、page.html の CLS を測定する際に CLS が含まれます。CrUX は Chrome のユーザー エクスペリエンス レポートであり、ユーザーはこれが iframe であることにさえ気づかない可能性があります。したがって、エクスペリエンスはトップレベルのページで測定され、ユーザーに対してどのように見えるかに従います。

ウェブサイトのアーキテクチャにより、CrUX でのデータの表現方法が複雑になる場合があります。たとえばシングルページ アプリ(SPA)では、ページ間の移動に従来のアンカーベースのページ ナビゲーションとは異なり、JavaScript ベースのルート移行スキームを使用していることがあります。ユーザーには新しいページビューとして見えますが、Chrome と基盤となるプラットフォーム API では、最初のページビューによってエクスペリエンス全体が関連付けられます。これは、CrUX が構築されているウェブ プラットフォーム API の制限です。詳しくは、web.dev の SPA アーキテクチャが Core Web Vitals に与える影響をご覧ください。

ユーザー

ユーザーが自身のエクスペリエンスを CrUX データセットに集約するには、次の条件を満たす必要があります。

  1. 使用統計情報レポートを有効にします。
  2. ブラウザ履歴を同期する。
  3. 同期パスフレーズが設定されていない。
  4. サポートされているプラットフォームを使用します。

現在サポートされているプラットフォームは次のとおりです。

  • PC 版 Chrome には、Windows、macOS、ChromeOS、Linux オペレーティング システムが含まれます。
  • Chrome の Android バージョン(カスタムタブWebAPKs を使用したモバイルアプリを含む)。

CrUX データセットにデータを提供しない重要な例外がいくつかあります。

  • Chrome(iOS)。
  • WebView を使用する Android アプリ。
  • その他の Chromium ブラウザ(Microsoft Edge など)。

Chrome では、これらの条件を満たすユーザーの割合に関するデータは公開されません。Google が収集するデータについて詳しくは、Chrome のプライバシー ホワイトペーパーをご覧ください。

Accelerated Mobile Pages(AMP)

AMP で構築されたページは、他のウェブページと同様に CrUX データセットに含まれます。2020 年 6 月の CrUX リリース以降、AMP キャッシュを使用して配信されたページや AMP ビューアでレンダリングされたページもキャプチャされ、パブリッシャーのページ URL に関連付けられます。

データ品質

CrUX のデータは少量の処理を経て、統計的に正確で、適切に構造化され、クエリしやすくなっていることを保証します。

フィルタリング

CrUX データセットは、提示されたデータが統計的に有効であることを確認するためにフィルタリングされます。これにより、ページ全体またはオリジンがデータセットに表示されない場合があります。

オリジンとページに適用される利用条件に加えて、データ内のセグメントにもさらにフィルタが適用されます。

ディメンションの組み合わせが不適切であるため総トラフィックの 20% 超が除外されているオリジンやページは、データセットから完全に除外されます。

グローバル レベルのデータセットにはすべての国のユーザー エクスペリエンスが含まれるため、国レベルでの人気基準を満たしていないディメンションの組み合わせでも、十分な人気があればグローバル レベルで含めることができます。

ファジング

センシティブ データのリバース エンジニアリング(総トラフィック量など)を防ぐために、データセットには少量のランダム性が適用されます。これは集計統計情報の精度には影響しません。

適合率

CrUX データセット内のほとんどの指標値は、値とビンサイズのヒストグラムとして表されます。ヒストグラム値は、含まれるすべてのセグメントの合計が 1 になる割合です。ビンのサイズは 1.0 ~ 0.0001 の浮動小数点数です。

ヒストグラムのビンの幅は正規化され、データのクエリと可視化が簡素化されます。つまり、ビンの幅を一定に保つために、大きなビンを小さなビンに分割して元の密度を均等に共有することができます。

ライセンス

Google の CrUX データセットは、クリエイティブ・コモンズの表示 4.0 国際ライセンスにより使用許諾されています。