先日公開された Microsoft Bing の Webmaster Blog の記事「 The Importance of Setting the “lastmod” Tag in Your Sitemap 」にて、( IndexNow を使ってね、とアピールしつつも )Bing においてはサイトマップの lastmod 属性が今後重要になることが明らかにされています。
lastmod 属性はサイトマップに記載されているURLの最終更新日を示すもので、検索エンジンがサイトを効率よくクロールするために利用します。
たとえば、こういう風に記述されるものですね。
<url>
<loc>https://www.tyto-style.com/3rd-note/</loc>
<lastmod>2023-02-06T20:24:50+00:00</lastmod>
</url>
同記事によると、Bing 上にインデックスされているウェブサイトにおける lastmod 属性の利用状況は次の通りです。
- 58%のホストが(Bingが把握できる形で)XMLサイトマップを持っている
- それらサイトマップの内、84%が lastmod 属性を設定している
- 79%が lastmode の値を正しく設定している
- 18%は正しく設定できていない
- 3%は一部のURLにだけ設定している
- それらサイトマップの内、16%は lastmod 属性を設定していない
- それらサイトマップの内、84%が lastmod 属性を設定している
- 42%のホストが(Bingが把握できる形で)XMLサイトマップを持っていない
この調査の結果を受けて、Bing では lastmod 属性が提供する情報を有効に活用するためにクロールのスケジューリングスタックが見直されており、6月までには完了する見込みとされています。
これによって、不要なクロールを減らし、更新されたコンテンツを優先的にクロールしてクロールの効率を向上させられるとのこと。
Bing ではなかなか URL がインデックスされないケースもありますので、そのあたりで悩んでいる方はサイトマップの設定を見直してみるのも良いかもしれませんね。
なお、同記事では lastmod 属性のよくある誤用として、日付がコンテンツの更新日ではなくサイトマップの更新日に設定されていて、すべての URL で同一になっているようなケースだと指摘されています。
このような誤用が確認された場合、サイトマップを無視することもあるとのことです。
また、changefreq と priority のふたつのタグにも触れられており、正確ではないことが多いので、多くの場合で無視するとしています。
lastmod タグの誤用が続くと信用されなくなることや、changefreq と priority を無視するのは Google も同様ですね。