リストモードの使い方

使い方

リストモードの紹介

SEO Spiderの基本的なクロールモードは、Webサイトを入力してクロールするデフォルトの「Spider」モードと、URLのリストをアップロードしてクロールする「List」モードの2種類です。

シンプルに聞こえますが、リストモードにはもう少し複雑で強力な高度な使い方があります。

まず、基本的なことを説明します。リストモードに切り替えるには、トップレベルのナビゲーションにある「モード > リスト」をクリックします。


リスト」モードは、通常の「スパイダー」モードとそれほど変わりませんが、2つの重要な違いがあります。

インターフェイスが変わり、アドレスバーの代わりにアップロードボタンが表示されます。
Limit Crawl Depth’ 設定は自動的に有効になり、’0′ に設定されます。これは、リストモードでアップロードしたURLのみがクロールされることを意味します。
2点目が重要な違いで、アップロードしたURLのみがクロールされるということです。これらのURLとその画像、外部リンクなどはクロールされません。アップロードされたURLのみをクロールし、それ以外のものはクロールしません*。

*ただし、JavaScriptレンダリングを使用している場合は、SEOスパイダーがヘッドレスChromeブラウザでページを正確にレンダリングするために、ページリソースをクロールする必要があることを除いては、です。

リストモードの以下のガイドを読み進めてください。

リストをアップロードする

リストモード(モード > リスト)では、「アップロード」ボタンをクリックし、ファイルからのアップロード、ダイアログボックスへの入力、URLのリストの貼り付け、XMLサイトマップのダウンロードを選択するだけです。


とてもシンプルですね。しかし、URLをアップロードする際、リストモードで最初に注意しなければならないことがいくつかあります。

プロトコルが必要

HTTPとHTTPSのどちらかが含まれていない場合(例:www.screamingfrog.co.uk/)、URLは読み込まれずアップロードされません。


found 0 URLs」というとても悲しいメッセージが表示されます。そのため、必ずプロトコルを含むURLを指定するようにしてください。

Screaming Frog | SEO, Search Engine Marketing Agency
We run remarkably successful search engine optimisation (SEO) and paid search (PPC) campaigns using a unique blend of data, technology & creativity.

正規化・重複排除

SEO Spiderはアップロード時にURLの正規化を行い、クロール時に重複を排除します。例えば、以下の4つのURLをアップロードするとします。

https://www.screamingfrog.co.uk/
https://www.screamingfrog.co.uk/#fragment-this-wont-be-crawled
https://www.screamingfrog.co.uk/seo-spider/
https://www.screamingfrog.co.uk/seo-spider/

SEOスパイダーは、クロールすべきユニークなURLの数を自動的に判断します。

小さなリストであれば、この4つのURLが実際には2つのユニークなURLであることは(ほとんどのSEO担当者にとって)簡単にわかりますが、大きなリストになると、それがわからなくなることもあります。

SEOスパイダーページは重複していますが、フラグメントURL(’#’付き)は別のユニークなURLと見なされないため、アップロード時に正規化されます。

これらのURLがSEO Spiderにアップロードされると、4つのURLを発見したことが報告され、ウィンドウのダイアログで正規化されます – 。


しかし、クロール時にはユニークなURL(この場合は2つ)しかクロールされません。


アップロードした4つのURLのうち、ユニークな2つのURLしかクロールされていませんが、アップロードした元のリストをそのままの順番でエクスポートすることができます。

エクスポート

リストモードからのデータのエクスポートは、通常通り、どのタブでも「エクスポートボタン」を使うだけでいいのです。

ただし、リストモードのデータをアップロードした順番でエクスポートして他のデータと照合したい場合は、ユーザーインターフェースの上部にある「アップロード」と「開始」ボタンの横にある「エクスポート」ボタンを使用します。


エクスポートされるデータは、同じ順番で、重複や修正されたものも含めて、アップロード元のURLと全く同じものが含まれます。


オリジナルURL」はアップロードされたURL、「アドレス」はSEOスパイダーがクロールしたURLです。

リストモードでの高度なクロール

リストモードは、適切なセットアップを行うことで、実にパワフルな機能を発揮します。リストモードは、適切な設定を行うことで、非常にパワフルな機能を発揮します。

URLのリストと別の要素をクロールする

リストモードでは、アップロードしたURLのリストと別の要素をクロールすることができ、非常に柔軟性があります。

例えば、URLのリストとその画像をクロールしたい場合。あるいは、サイト全体ではなく、URLのリストとその新しく実装されたcanonicals、AMP、hreflangを監査する必要があった場合。あるいは、リンク切れを防ぐために、URLの一覧からすべての外部リンクを収集したい場合。これらはすべてリストモードで実行でき、プロセスはほとんど同じです。

リストモードにしたら、自動的に「0」に設定されているクロール深度の制限を解除してください。Config > Spider > Limits」で、設定のチェックを外してください。


これは、SEOスパイダーがURLのリスト、およびそれらがリンクしている同じサブドメイン上のすべてのURLをクロールするようになったことを意味します。

そのため、きめ細かい設定オプションでクロールされる対象を制御する必要があります。設定 > Spider > クロール’に移動します。クロール “の設定メニューで、”リソースリンク “と “ページリンク “をすべて無効化します。

次に、URLのリストと一緒に「クロール」したい要素を選択します。例えば、URLのリストとその画像をクロールしたい場合は、次のような設定になります。


また、SEOスパイダーページのような単一のURLをアップロードすると、ページとその画像の両方がクロールされることがわかります。


この高度な設定により、必要なリンク要素に的を絞った監査が可能になります。

リダイレクトの監査

サイトの移行に伴うリダイレクトを監査する場合、ターゲットURLと遭遇したリダイレクトチェーンをクロールすることが特に有効な場合があります。これにより、ターゲットURLの複数のリストを毎回アップロードして、最終的な結果を得る必要がなくなります。

このシナリオでは、’Config > Spider > Advanced’の ‘always follow redirects’設定を使用することをお勧めします。この設定を有効にすると、「クロール深度の制限」は無視され、リダイレクトは3XX以外のレスポンスに到達するまで(または「設定 > Spider > 制限」内の「最大リダイレクト数」の制限に達するまで)追跡されます。


その後、「すべてのリダイレクト」レポートを使用すると、リダイレクトの全チェーンを1つのレポートにマッピングすることができます。


このプロセスの詳細については、「サイト移行におけるリダイレクトの監査方法」のガイドをお読みください。

APIへの接続

リストモードでは、GA、GSC、PSI、バックリンク解析ツールのAPIに接続し、データを取り込むことが可能です。例えば、AhrefsのAPIに接続し、参照ドメイン、キーワード、トラフィック、値などのデータを取得し、「リンクメトリクス」タブに表示することができます。


これは、例えば競合分析のためのデータ収集に超有用です。

コメント

タイトルとURLをコピーしました