为 Hexo 博客进行 SEO

本文最后更新于 <span id="expire-date"></span> 天前,文中部分描述可能已经过时。

自从2月初搭建好我的个人博客之后,写了两篇文章一直没有被 Google 收录,于是找了一些关于 Hexo 站点 SEO 的资料,做了一下我博客的 SEO (😂现在 Google 已经能够搜索到我的博客的文章了。)

修改 Hexo 的默认配置生成更简洁的链接

Hexo 的默认配置生成的链接的的格式是 :year/:month/:day/:title/, Google 是不推荐这样做的,所以我们最好对它进行修改。我列举两种方式,可以根据喜好自己选择

  • 直接修改站点的 _config.yml
# permalink: :year/:month/:day/:title/
permalink: archives/:title # 修改成其他样式也可以
# 安装 hexo-abbrlink
npm install hexo-abbrlink --save

# 然后修改站点根目录的 `_config.yml`
permalink: posts/:abbrlink/

# 插件还有些自定义选项,可以去 Github 查看它的文档

生成 sitemap

sitemap 可以让搜索引擎更容易爬到站点的目录(特别是对新建的站点),Hexo 官方插件有很多两个生成 sitemap 的插件, 我基本上都尝试了一遍,觉得比较好的是 hexo-generator-seo-friendly-sitemap ( 但我用的是不在官方插件里的 hexo-generator-better-sitemap

  • 在站点目录安装 hexo-generator-seo-friendly-sitemap
npm install hexo-generator-seo-friendly-sitemap --save

# npm i hexo-generator-better-sitemap --save
  • 编辑站点的 _config.yml,加入下面的内容
sitemap:
    path: sitemap.xml
    tag: false # 按需选择
    category: false # 按需选择

如果你有想要排除在 sitemap 文件外的页面或者文章,可以在 Front-Matter 加入 sitemap: false

使用 robots.txt 阻止不必要的抓取

您可能不希望网站的某些页面被抓取,因为这些页面显示在搜索引擎的搜索结果中可能对用户无用。 – Google 的 SEO 新手指南
“robots.txt”文件会告诉搜索引擎是否可以访问您网站的各个部分并执行抓取。此文件必须命名为“robots.txt”,且应位于网站的根目录下。 – Google 的 SEO 新手指南

上面的文字将 robots.txt 的作用解释的很清楚了,那我们直接动手

  • /source 文件夹里新建一个 robots.txt

  • 根据站点的需求加入规则

例如像我的站点,我有搜索和标签两个页面不想被搜索引擎收录,所以我的robots.txt 的内容是下面这样的。

User-agent: *
Allow: /
Allow: /archives/
Allow: /about/
Allow: /links/

Disallow: /tags/
Disallow: /search/

Sitemap: https://blog.ghkk.net/sitemap.xml

为外链添加 nofollow 属性

nofollow 标签表示作者不想宣传链接的文档,例如,它是不受控的,它是一个坏的例子或如果它们有商业关系(销售环节)。nofollow主要是被一些使用人气排名技术的搜索引擎所使用 – MDN web doc

简而言之,为外链添加 nofollow 可以让搜索引擎不爬取出站的内容,对我的小破站来说没什么用可以避免被垃圾外链影响站点的权重。

对于 nofollow 这个标签我们也不能自己一个个加,我的解决方法是安装 hexo-filter-nofollow 这个插件

  • 安装插件
npm i hexo-filter-nofollow --save
  • 对插件进行自定义
nofollow:
  enable: true # 是否启用
  field: site # 插件的处理范围,默认是 site,可选 post
  exclude: # 域名白名单
    - 'blog.ghkk.net'
    - 'kaidora.github.io' # 朋友的博客

对于插件文档可以查看作者 Sukka 的这篇文章

向搜索引擎提交你的 sitemap

Google

  • 打开 Google Search Console 添加你的站点并验证所有权

    • 可以参考 Google 的文档 - 添加网站资源

    • 有些主题也提供了方便的验证站点所有权的方法,可以查找主题的文档寻求帮助

  • 在 Search Console 中添加网站的 sitemap 文件

    • 点击左边导航栏上的 Sitemaps

    • 添加站点的 sitemap 并提交

    • 等待 Google 爬取

等待一两小时就可以在 Google 看到你的搜索结果了。

参考资料

Thumbnail material from Storyset

为 Hexo 博客进行 SEO
本文作者
Haukeng Ghou
最后更新
2021-03-16
许可协议
转载或引用本文时请遵守许可协议,注明出处、不得用于商业用途!

评论

您所在的地区可能无法访问 Disqus 评论系统,请切换网络环境再尝试。