Docker与普通虚拟机有何不同?

我一直在重读Docker文档,试图理解Docker和完整虚拟机之间的区别。 它如何设法提供完整的文件系统,隔离的网络环境等,而不会太重?

为什么将软件部署到码头图像(如果这是正确的话)比简单地部署到一致的生产环境更容易?


Docker最初使用LinuX Containers(LXC),但后来转向运行在与主机相同操作系统的runC(以前称为libcontainer )。 这使它可以共享大量的主机操作系统资源。 此外,它使用分层文件系统(AuFS)并管理网络。

AuFS是一个分层文件系统,因此您可以将只读部分和写入部分合并在一起。 可以将操作系统的公共部分设置为只读(并在所有容器之间共享),然后为每个容器设置自己的写入容器。

所以,假设你有一个1 GB的容器图像; 如果你想使用一个完整的虚拟机,你需要有1GB的x个虚拟机。 使用Docker和AuFS,您可以在所有容器之间共享1 GB的大部分内容,并且如果您拥有1000个容器,则容器操作系统的容量可能只有略多于1 GB(假设它们都运行相同的OS映像) 。

完整的虚拟化系统获得自己分配给它的一组资源,并且实现最少的共享。 你会得到更多的隔离,但它要重得多(需要更多的资源)。 使用Docker你可以获得更少的隔离,但容器是轻量级的(需要更少的资源)。 因此,您可以轻松地在主机上运行数千个容器,甚至不会眨眼。 试着用Xen来做这件事,除非你有一个非常大的主机,否则我认为这是不可能的。

完整的虚拟系统通常需要几分钟才能启动,而Docker / LXC / runC容器需要几秒钟的时间,通常甚至不到一秒钟。

每种类型的虚拟化系统都有优点和缺点。 如果您希望完全隔离并保证资源充足,那么完整的虚拟机是最佳选择。 如果你只是想将进程彼此隔离开来,并希望在合理大小的主机上运行大量进程,那么Doc​​ker / LXC / runC似乎就是要走的路。

欲了解更多信息,请查看这组博客文章,该文章很好地解释了LXC的工作原理。

为什么将软件部署到码头图像(如果这是正确的话)比简单地部署到一致的生产环境更容易?

部署一致的生产环境说起来容易做起来难。 即使你使用Chef和Puppet这样的工具,也总会有OS更新和其他东西在主机和环境之间改变。

Docker为您提供了将操作系统快照到共享映像的功能,并且可以轻松部署到其他Docker主机上。 在本地,dev,qa,prod等:所有相同的图像。 当然你可以用其他工具来做到这一点,但并不是那么简单或快速。

这对测试非常有用; 假设您有数千个需要连接到数据库的测试,并且每个测试都需要数据库的原始副本,并将对数据进行更改。 传统方法是在每次测试后重置数据库,无论是使用自定义代码还是使用Flyway这样的工具 - 这可能非常耗时且意味着测试必须连续运行。 但是,使用Docker,您可以创建数据库的映像,并在每个测试中运行一个实例,然后并行运行所有测试,因为您知道它们都将针对数据库的相同快照运行。 由于测试并行运行并在Docker容器中运行,它们可以同时在同一个盒子上运行,并且应该快得多。 尝试使用完整的虚拟机做到这一点。

来自评论...

有趣! 我想我仍然被“快照操作系统”的概念弄糊涂了。 如果没有,做一个操作系统的形象,人们如何做到这一点?

那么,让我们看看我能否解释。 您从基础映像开始,然后进行更改,然后使用docker提交这些更改,并创建一个映像。 此图像仅包含与底座的差异。 当你想运行你的图像时,你也需要基础,并且使用分层文件系统将图像分层到基层之上:如上所述,Docker使用AUFS。 AUFS将不同的层合并在一起,你就可以得到你想要的; 你只需要运行它。 您可以继续添加越来越多的图像(图层),它将继续保存差异。 由于Docker通常基于注册表的现成图像构建,因此您很少必须自己“快照”整个操作系统。


很好的答案。 为了获得容器vs VM的映像表示,请看下面的代码。

在这里输入图像描述

资料来源:https://www.docker.com/what-c​​ontainer#/package_software


我喜欢Ken Cochrane的回答。

但我想补充一些观点,这里没有详细介绍。 在我看来,Docker在整个过程中也有所不同。 与虚拟机不同,Docker并不仅仅是关于硬件的最佳资源共享,而且它为包装应用程序提供了一个“系统”(优选但不是必须的,作为一组微软服务)。

对我来说,它适合于面向开发人员的工具,如rpm,debian软件包,maven,npm + git和Ops工具如Puppet,VMWare,Xen等。

为什么将软件部署到码头图像(如果这是正确的话)比简单地部署到一致的生产环境更容易?

你的问题假设有一致的生产环境。 但如何保持一致? 考虑一些数量(> 10)的服务器和应用程序,流水线中的各个阶段。 为了保持同步,您将开始使用Puppet,Chef或自己的配置脚本,未发布的规则和/或大量文档等......理论上,服务器可以无限期运行,并保持完全一致且最新。 练习无法完全管理服务器的配置,因此存在相当大的配置漂移范围以及运行服务器的意外更改。

所以有一种已知的模式来避免这种情况,即所谓的不可变服务器 。 但不可变的服务器模式并未被人喜爱。 主要是因为VM的局限性,所以在Docker之前使用了它。 处理几千兆字节的大图像,移动这些大的图像,只是为了改变应用程序中的一些字段,非常费力。 可以理解的......

通过Docker生态系统,您不需要在“小改动”(感谢aufs和Registry)的情况下移动千兆字节,并且您无需担心在运行时将应用程序打包到Docker容器中而导致性能下降。 您不必担心该图像的版本。 最后,即使在您的Linux笔记本电脑上,您甚至会经常能够复制复杂的生产环境(如果您的情况不起作用,请不要打电话给我);)

当然你可以在虚拟机中启动docker容器(这是个好主意)。 减少在VM级别的服务器供应。 以上所有可以由Docker管理。

PS同时,Docker使用自己的实现“libcontainer”而不是LXC。 但LXC仍然可用。

链接地址: http://www.djcxy.com/p/385.html

上一篇: How is Docker different from a normal virtual machine?

下一篇: How do I sort a dictionary by value?