餡のいろ

日々の調べたこと色々メモ。

はてなブログのサイトマップ送信状況を観察しています(2019年5月-6月)

みんな困っているようです

Google Search Consoleで「はてなブログサイトマップ」の送信がうまくいかない、送信できてもURLの検出数が少ない等、想定どおりの結果が得られない問題について。グーグルのヘルプ(コミュニティ)を覗いたら結構たくさんのユーザーさんが困っていているけど未だ解決策がない状況にあるのがわかりました。(2019年5月時点)

検索結果: はてなブログ サイトマップ

support.google.com

 

どうも素人がジタバタしてもどうにもならなそうなので、できることをやって(サイトマップを送信して)観察してみています。

※2020年6月27日追記
はてなブログよくあるお問い合わせに有力情報ありました!

はてなブログでも事象を確認していて調査をしているようです。

Q.GoogleSearchConsoleからのサイトマップ送信に失敗する問題について
A.サイトマップは sitemap_index.xml を送信してください。

hatena.zendesk.com 

はてな Support

 

---以下は2019年5月に書いた記事です---

このブログのサイトマップの状況と見られる現象

このサイトの場合、サイトマップとしてサイトマップインデックスとfeedとrssを送信しました。

 

4.まとめ-私が登録したサイトマップ

はてなブログのサイトマップはどのファイル? - 餡のいろ

 

サイトマップを送信して約1ヶ月となる今(2019年5月中旬)のところサイトマップがらみで見られた「よくわからない」現象は、

  1. サイトマップを送信しても「取得できませんでした」になる
    →feedは送信後しばらく「取得できませんでした」のままで、3週間くらいで突然「成功しました」となった(rssは依然として「取得できませんでした」)

  2. サイトマップインデックスを送信して「成功しました」になっても配下のサイトマップを検出していない
    →しばらく検出されないままだったけど、ある日突然(たぶん3~4週間くらいで)検出されていた

  3. サイトマップインデックス配下のサイトマップ(複数)が一回ちゃんと検出されていても、数日で突然消えていたり(一つだけ消えたり、二つ消えたり、ばらばら)、突然ちゃんと戻っていたりする
    →この状況はずっと続いています

  4. /sitemap.xml?page=2は「成功しました」なのに、/sitemap.xml?page=1はステータス「取得できませんでした」詳細には「サイトマップを読み込めませんでした」となる。見ている限りpage=1は一回も成功していない。
    →3の状況が続いているので何とも言えないが、これも変わらず

しばらく様子を見ていてもサイトマップの1~3の現象は繰り返し数日おきに登録されたり消えたりしていて、はてなブログサイトマップの問題なのかGoogle検索エンジンの問題なのかよくわかりません。

 

あと気づいたことは、

逆も然りで、インデックス カバレッジ画面に「有効」で「インデックス登録されましたが、サイトマップに送信していません」となっている記事もある。
これは不具合とかでなく、サイトマップの送信状況とインデックス カバレッジの送信状態は必ずしも一致していないものらしい。初歩的なんだろうなぁ、、、今、気づいたよ。(ちゃんとインデックスとサイトマップの両方に登録されている記事もあります。)

 サイトマップを送信する目的は記事をインデックスに登録すること

サイトマップで検出されていない記事がインデックスされていたり、サイトマップを送信する前の知らぬ間にインデックスされていた記事があったり、サイトマップに関係なくインデックスされるも記事があります。

サイトマップを送信するそもそもの目的は「記事がインデックスされること」だと考えると、サイトマップの送信状況に一喜一憂しないで粛々と記事を書いたりブログのメンテナンスをしながら、焦らず静観して観察を継続していこうと思う。

 

【2019年7月追記】

サイトマップを読み込めませんでした はてなブログ」で検索すると有用な情報がたくさんでてくる。

はてなブログだけでなくWordPressワードプレス)の利用者でも同じ声があがっていてGoogle Search Consoleが新しいバージョンになってから挙動がおかしくなったというのが共通する見方のようです。Google側のサイトマップの仕様がかわったのではないかとの声もあったりします。

WordPressの場合はサイトマップを生成するためのプラグインを「Google XML Sitemaps」に変えたらうまくいったというのがチラホラ。

はてなブログの場合はサイトマップインデックス、サイトマップすべてをサチコで送信して待つ、というのが実践した方々の報告でした。
なんでや!単体にして読めるなら全部読めるはずではないか?ってちょっと納得いかないなぁ。

 

【2019年12月追記】

最初に登録してから半年あまり。あれから記事が増えサイトマップは4つになっている。相変わらず私はsitemapインデックスのみ送信して粘っている状態。

サイトマップの登録の様子を時々見ていますが、sitemapインデックスに紐づくサイトマップはちゃんとぶら下がってくるけど、一部のサイトマップだけ登録に「成功」していたり、また次に見ると、すべて「取得できませんでした」となったりしている。

カバレッジをみても「有効」になっていると思っていたら、あるとき大量に「除外」になったりしている。

Googleロボットは気まぐれなのか。(いや、たぶん何かキッカケがあるはずだけど)
でもしかしサイトマップは登録失敗していても、カバレッジで除外されていても、ユーザがやってくるページもある。
あまり熱くなっても仕方ないかと静観している。