如何正确使用有状态的Python模块实现测试隔离?

我正在开发的这个项目是一个封装成Python包的业务逻辑软件。 这个想法是,各种脚本或应用程序将导入它,初始化它,然后使用它。

它目前有一个顶层的init()方法来完成初始化并设置各种东西,一个很好的例子是它使用db连接设置SQLAlchemy并存储SA会话以供以后访问。 它被存储在我的项目的一个子包中(即myproj.model.Session,所以其他代码可以在导入模型后得到一个工作的SA会话)。

长话短说,这使得我的软件包成为有状态的软件包。 我正在为这个项目编写单元测试,这种有效的行为带来了一些问题:

  • 测试应该被隔离,但是我的包的内部状态打破了这种隔离
  • 我不能测试主要的init()方法,因为它的行为取决于状态
  • 未来的测试将需要针对具有众所周知的模型状态的(尚未写入的)控制器部分运行(例如,预填充的sqlite内存数据库)
  • 我是否应该重构我的包,因为当前的结构不是最佳(可能)实践(tm)? :)

    我应该把它留在那里,每次都设置/拆卸整个事物吗? 如果我要实现完全隔离,这意味着在每次测试中完全擦除并重新安装db,是不是过度杀伤?

    这个问题实际上是关于整体代码和测试结构的,但是为了我的测试,我使用了nose-1.0。 我知道Isolate插件可能可以帮助我,但我想在测试套件中做出奇怪的事情之前先获得代码。


    你有几个选择:

    模拟数据库

    有几个权衡需要注意。

    您的测试将变得更加复杂,因为您必须进行连接的设置,拆卸和模拟。 您可能还想要验证发送的SQL /命令。 它也倾向于创建一种奇怪的紧耦合,这可能会导致您在架构或SQL更改时花费额外的时间维护/更新测试。

    这通常是最纯粹的测试隔离,因为它减少了对测试的大量依赖。 它还倾向于加快测试速度,并减少在持续集成环境中自动化测试套件的开销。

    用每个测试重新创建数据库

    权衡意识。

    这可能会使测试非常缓慢,具体取决于实际重新创建数据库需要多长时间。 如果开发数据库服务器是共享资源,则必须额外进行初始投资,以确保每个开发人员在服务器上都有自己的数据库。 取决于测试运行的频率,服务器可能会受到影响。 在持续集成环境中运行测试套件需要额外的开销,因为它至少需要更多的dbs(取决于同时构建多少分支)。

    好处与实际运行相同的代码路径和将用于生产的类似资源相关。 这通常有助于早期发现错误,这总是一件非常好的事情。

    ORM DB交换

    如果您使用SQLAlchemy这样的ORM,那么您可以将底层数据库与可能更快的内存数据库交换。 这样可以减轻以前两个选项的一些负面影响。

    它与生产中使用的数据库不完全相同,但ORM应该有助于减轻掩盖错误的风险。 通常,设置内存数据库的时间比文件备份的时间短得多。 它还具有隔离到当前测试运行的好处,因此您不必担心共享资源管理或最终拆卸/清理。


    使用相对昂贵的设置(IPython)处理项目时,我已经看到了一种使用get_ipython函数的方法,该函数设置并返回一个实例,同时用一个函数返回对现有实例的引用。 然后,每个测试都可以调用相同的功能,但它只能完成第一个测试的设置。

    这为每次测试节省了很长的设置步骤,但偶尔会造成测试失败或通过的奇怪情况,具体取决于之前运行的测试。 我们有办法处理这个问题 - 很多测试应该做同样的事情,不管状态如何,我们可以尝试在某些测试之前重置对象的状态。 你可能会发现一个类似的权衡为你工作。


    模拟是一个简单而强大的工具来实现一些隔离。 有一个来自Pycon2011的视频,展示了如何使用它。 我建议将它与py.test一起使用,这会减少定义测试所需的代码量,并且仍然非常非常强大。

    链接地址: http://www.djcxy.com/p/6263.html

    上一篇: How to correctly achieve test isolation with a stateful Python module?

    下一篇: Export Datagridview records to Excel