GitHub Pages和Jekyll内容重复和SEO问题
我正在寻找使用GitHub Pages来托管我的博客和Jekyll来呈现它。
据推测,无论我承诺通过Jekyll和https://github.com/<yourname>/<yourname>.github.io
以rawer的形式出现在<yourname>.github.io
中。 请参阅此页面,其中显示链接到活动网站以及用于构建它们的源回购站。
关于搜索引擎优化的建议表明,重复域内和跨域的内容是不好的SEO实践。 请参阅此Google重复支持页面和Moz关于重复问题的页面,这两个问题也提供了可能的解决方案。
我的问题有两方面:
noindex
等解决方案应用于GitHub库,以便搜索引擎知道您的Jekyll网站是经典网站? 更新:
值得注意的是,我上传了一个“hello world”索引文件到我的GitHub Pages repo中,然后在GitHub上检查了该页面的源代码。 GitHub源已经包含一个规范链接
<link rel="canonical" href="https://github.com/guypursey/guypursey.github.io/blob/master/index.html" data-pjax-transient>
我认为这是需要更改每个文件以指向该网站的Jekyll版本,但我无法在GitHub中看到处理该文件的设置。
如果存储库是公共的,那么在与用户和组织使用GitHub页面时,重复的内容是不可避免的
一般来说,这不应该是一个问题。 查看以前的答案。
你有几个选择:
gh-pages
分支而不是master
分支。 由于GitHub的robots.txt只允许搜索引擎抓取主分支并且不允许其他分支。 因此,如果该网站位于gh-pages
分支中,则会阻止Google查看存储库。 上一篇: GitHub Pages and Jekyll content duplication and SEO issues