建站随笔,  网站搭建

快速生成Sitemap并将其提供给谷歌百度以加快收录

本文于2021年1月21日由AlvinCR更新

我个人文章在非允许的状况下被盗用,而我站点原创文章却没有被谷歌和百度收录…..我也没精力去一一查询举报,毕竟很多都是用脚本进行采集,我能做的:(1)在每篇文章中都插入我网站的地址,让他们帮我做推广吧。(2)尽可能写有用的文章,让大家知道原作者是谁。

0 不同格式网站地图的区别

xml格式和txt格式是给搜索引擎看的,而html格式是给用户看的

站点图式格式 区别说明
html格式 1、html格式方便用户快速寻找到网站内步的页面
2、让网站结构扁平化
3、给搜索引擎蜘蛛提供抓取页面入口
xml格式 1、各个搜索引擎站长平台都支持的站点地图格式,可以直接通过站长平台进行提交
2、提供多种数据,比如 Priority(优先级) Lastmod(最终修改时间)等等数据。方便搜索引擎蜘蛛判断,也是综合上最为友好的形式。
txt格式 1、数据简洁,加载速度快
2、在谷歌中可以快速的进行Ping提交

xml格式和txt格式相比于html格式,在同等数据量的情况下,体积更小(很多自只有几十KB)。搜索引擎读取时不需要加载很多资源,抓取速度会变快。

相反,html格式是给用户看的。用户角度的视觉效果,以及用户找到对应页面的速度要比xml和txt快很多。

https://park.mobayke.com/tools/for-sitemap.html

1 原因

我个人文章在非允许的状况下被盗用,而我站点原创文章却没有被谷歌和百度收录…..

2 手动添加

1 生成sitemap站点地图

这里我用的是下面的工具自动生成站点地图:

http://tools.bugscaner.com/sitemapspider

先生成适用于谷歌的站点地图,alvincr个人设置如下,alvincr认为最好百度和谷歌分开创建站点地图。

生成后下载xml格式的站点地图,txt格式太过于古老,最好别用。

2 放置站点地图

在alvincr.com下创建一个目录,我这里创建的是sitemap文件夹,上传下载的文件到文件夹中,然后重命名为alvincr.com_2021.1.8.xml

3 提供sitemap

alvincr.com翻译原文为谷歌官方文档:https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?hl=zh-cn#addsitemap

Google 并非每次抓取网站时都会查看站点地图。我们仅在首次发现站点地图时查看;之后仅在您使用 ping 功能通知我们站点地图有变更时查看。请仅在新建或更新站点地图时向 Google 发送站点地图相关提醒。如果站点地图无任何变更,请勿多次向我们提交或 ping 站点地图。

您可通过以下几种不同方法将站点地图提供给 Google:

  • 使用 Search Console 站点地图工具将其提交给 Google
  • 将下面这行内容插入到 robots.txt 文件中的任意位置,以指定指向您站点地图的路径。
    Sitemap: http://example.com/sitemap_location.xml
  • 使用“ping”功能请求我们抓取站点地图。发送如下所示的 HTTP GET 请求:
    http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    例如:
    http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

方法一:使用 Search Console 站点地图

打开站点地图报告,右上角search property选择alvincr.com网站。

添加站点地图所在服务器中的地址,按照上面操作可知我将其放在了sitemap文件夹中,命名为alvincr.com_2021.1.8.xml,注意sitemap前面不要加/,谷歌默认加好了

添加成功显示界面:

 

方法二:使用robots

robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据(Metadata,又称元资料)。

我记得关于robots的文章我有写过,可以使用搜索功能搜索一下,但是我在处理问题的时候把原有的robot文件删除了,这里需要重新建立一个空白文件,然后添加如下代码:

Sitemap: http://alvincr.com/sitemap/alvincr.com_2021.1.8.xml

 

方法三:使用ping功能,我认为这个还挺方便的

http://www.google.com/ping?sitemap=:http://alvincr.com/sitemap/alvincr.com_2021.1.8.xml

2021.1.8补充:

不要使用上述方法ping网站地图,最好是ping新建的url链接。

方法四:2021.1.8补充

在wp后台-设置-撰写中添加更新服务,例如百度的更新为http://ping.baidu.com/ping/RPC2

3 自动添加

使用seo插件按照相关设置即可,基本不用操作什么,seo会自动默认添加站点地图。

All in one SEO 个人感觉效果不好,毕竟这么久了好像也没看到收录,也许是我这边设置的问题。

New Search Console(谷歌官方工具)

Link Processor

4 附:百度提交

地址:https://ziyuan.baidu.com/linksubmit/index

按照上文获得百度的sitemap文件,放到服务器中并重命名。

5 查看收录情况(2021.1.21补充)

直接通过搜索引擎一个个查看网页是否被收录效果极差,而且根本看不出来页面是否被收录

你看我直接搜索网站根本就没怎么显示页面文章,只收录了首页,而且第二个页面还是别人盗取我的文章…..

推荐在搜索引擎中使用site:alvincr.com进行搜索。

个人测试发现使用site:www.alvincr.com无法找到搜索结果,可能是因为www我设置为cname解析而非A类解析的缘故。

声明:本文作者及所有权归alvincr所有,地址:alvincr.com

Leave a Reply

邮箱地址不会被公开。 必填项已用*标注

快速生成Sitemap并将其提供给谷歌百度以加快收录