Screaming Frog SEO Spiderを無料(有料)で利用することで、Webサイトのリンク切れ(httpレスポンスの「404 not found error」)をチェックすることができます。
以下は、リンク切れチェッカーとしてのツールの使い方の簡単なチュートリアルです。
有料版では、500URL以上をクロールすることができます。あなたのウェブサイト内の壊れたリンクを見つけるための次のステップは、以下のチュートリアルで見ることができます
ウェブサイトをクロール
SEO Spiderを起動し、「Enter URL to spider」ボックスにクロールしたいウェブサイトを入力またはコピーして、「Start」をクリックします。
「レスポンスコード」タブと「クライアントエラー(4XX)」フィルタをクリックして、リンク切れを表示します
クロールが終了して100%になるまで待つこともできますが、「レスポンスコード」タブに移動して「クライアントエラー4XX」のフィルタを使用すれば、クロール中に404のリンク切れを表示することができます。
この方法には2つあり、上部の「タブ」をクリックし、ドロップダウンフィルタを使用することができます。
または、右側のウィンドウのクロールの概要ペインを使用して、「レスポンスコード」フォルダの下の「クライアントエラー(4xx)」ツリービューを直接クリックすることも可能です。どちらの方法でも、同じ結果が表示されます。
このクロール概要ペインは、クロール中に更新されるので、クライアントエラー4XXのリンク数が一目瞭然にわかるようになっています。上記の例では、クライアントエラーが9件で、クロールで発見されたリンクの0.18%に相当します。
「リンク」タブをクリックしてリンク切れのソースを表示する
当然ながら、発見されたリンク切れの原因(WebサイトのどのURLからリンク切れが発生しているか)を知ることで、修正することができます。これを行うには、単に上のウィンドウペインでURLをクリックし、下のウィンドウペインに入力する下部にある[リンク]タブをクリックします。
上記をクリックすると、大きな画像を表示することができます。この例でわかるように、BrightonSEOのウェブサイト(https://www.brightonseo.com/people/oliver-brett/)へのリンクが切れており、このページ(https://www.screamingfrog.co.uk/2018-a-year-in-review/)からリンクされていることがわかります。
下のウィンドウの「inlinks」データを詳しく見てみましょう。
「From」は404のリンク切れを発見できるソースで、「To」はリンク切れを起こしているリンクです。また、アンカーテキスト、altテキスト(ハイパーリンク先の画像の場合)、リンクがfollowed(true)かnofollow(false)かを確認することができます。
リンク切れは外部リンク(リンクしているサイト)のみのようですが、SEOスパイダーは内部リンク切れを発見してくれるはずです。
「Bulk Export > Response Codes > Client Error (4XX) Inlinks」エクスポートを使用する
スプレッドシートでデータを表示したい場合は、トップレベルメニューの「一括エクスポート」、「レスポンスコード」、「クライアントエラー(4XX)リンク」を使用して、「ソース」URLと「リンク切れ」の両方をエクスポートすることができます。
これは、ウェブサイト上のリンク切れを見つけるためのケースの大部分をカバーする必要があります。
しかし、「ソース」URLは、404エラーページにリンクする一番最後のページです。そのため、「ソース」がリダイレクトになっている場合もあるかもしれません(リダイレクトの連鎖になっている可能性もあります)。ソース」がリダイレクトであるかどうかは、例えば「タイプ」欄に「HTTPリダイレクト」と表示されることで確認することができます。
これらのエラーの元のページを素早く見つけるには、「レポート > リダイレクト > すべてのリダイレクト」の「すべてのリダイレクト」エクスポートを使用することをお勧めします。レポートを開き、’final status code’ カラムを ‘404’ にフィルタリングしてください。Source」は元のソースページ、「address」は最後のソース、「final address」は404のURLです。
SEO Spiderからデータをエクスポートするには様々な方法がありますので、エクスポートに関するユーザーガイドをお読みください。
リンク切れのURLのリストをクロールする
最後に、ウェブサイトをクロールする代わりに、リンク切れをチェックしたいURLのリストがある場合、リストモードでアップロードするだけです。
リストモードに切り替えるには、トップレベルのナビゲーションから「モード > リスト」をクリックし、URLを貼り付けるか、ファイル経由でアップロードするかを選択します。
リンク切れの「ジャンプリンク」を探す
ジャンプリンクは、リンク上の名前付きアンカーを使用してユーザーをウェブページの特定の部分にリンクする便利な方法で、「ブックマーク」「名前付きアンカー」「スキップリンク」とも呼ばれます。
これらの壊れたブックマークは、404ステータスコードで応答しないため、上記と同じ方法で見つけることができず、気づかれないことが多いのです。
設定 > スパイダー > 詳細」にある「クロール断片の識別子」を有効にし、ウェブサイトをクロールした後、「URL」タブと「壊れたブックマーク」フィルターで表示する必要があります。
ジャンプリンク切れを発見するためのチュートリアルをお読みください。
上記のガイドは、SEOスパイダーツールを使って効率的にリンク切れをチェックする方法を説明するのに役立つと思います。
コメント