GitHub Pages和Jekyll内容重复和SEO问题

我正在寻找使用GitHub Pages来托管我的博客和Jekyll来呈现它。

据推测,无论我承诺通过Jekyll和https://github.com/<yourname>/<yourname>.github.io以rawer的形式出现在<yourname>.github.io中。 请参阅此页面,其中显示链接到活动网站以及用于构建它们的源回购站。

关于搜索引擎优化的建议表明,重复域内和跨域的内容是不好的SEO实践。 请参阅此Google重复支持页面和Moz关于重复问题的页面,这两个问题也提供了可能的解决方案。

我的问题有两方面:

  • 内容重复实际上是GitHub Pages的一个问题吗?
  • 如果是这样的话,那么如何将标准链接或noindex等解决方案应用于GitHub库,以便搜索引擎知道您的Jekyll网站是经典网站?

  • 更新:

    值得注意的是,我上传了一个“hello world”索引文件到我的GitHub Pages repo中,然后在GitHub上检查了该页面的源代码。 GitHub源已经包含一个规范链接

    <link rel="canonical" href="https://github.com/guypursey/guypursey.github.io/blob/master/index.html" data-pjax-transient>
    

    我认为这是需要更改每个文件以指向该网站的Jekyll版本,但我无法在GitHub中看到处理该文件的设置。


    如果存储库是公共的,那么在与用户和组织使用GitHub页面时,重复的内容是不可避免的

    一般来说,这不应该是一个问题。 查看以前的答案。

    你有几个选择:

  • 谷歌和其他搜索引擎显然不能访​​问需要付费计划的私人存储库。
  • 切换到项目页面。 这将使用gh-pages分支而不是master分支。 由于GitHub的robots.txt只允许搜索引擎抓取主分支并且不允许其他分支。 因此,如果该网站位于gh-pages分支中,则会阻止Google查看存储库。
  • 链接地址: http://www.djcxy.com/p/62523.html

    上一篇: GitHub Pages and Jekyll content duplication and SEO issues

    下一篇: SEO & WordPress: Changing category links manually