awk与1970年以前的日期

从https://www.gnu.org/software/gawk/manual/html_node/Time-Functions.html我明白, gawk只有2个函数在日期/时间mktimestrftime

所以,我可以使用mktime解析任何返回一个long的日期,所以我可以做任何数学运算,所以我可以用strftime格式化所需的输出

这工作就像"1970 01 01 00 00 00""1970 01 01 00 00 00"之后的任何日期的魅力一样,

使用awk,我如何格式化1970年以前的日期?

$ awk 'BEGIN{t=mktime("1970 01 01 00 00 00"); print t; print strftime("%Y-%m-%d", t) }'
10800
1970-01-01
$ awk 'BEGIN{t=mktime("1960 01 01 00 00 00"); print t; print strftime("%Y-%m-%d", t) }'
-315608400
awk: cmd. line:1: (FILENAME=- FNR=1) fatal: strftime: second argument less than 0 or too big for time_t

不幸的是,正如你所看到的,gawk不能直接做到这一点。 gawk手册说:

所有已知的符合POSIX标准的系统都支持从0到2 ^ 31 - 1的时间戳,这足以表示通过2038-01-19 03:14:07 UTC的时间。 许多系统支持更广泛的时间戳,包括表示时代之前的负面时间戳。

如果给出超出范围的日期,手册没有说明strftime()做什么。

但即使在我的系统上,它对负的time_t值表现出明智的表现,gawk的strftime()函数不支持它们(尽管mktime()会),所以不能处理1970年之前的日期。我认为这是一个bug在gawk。

(我的建议是使用Perl而不是Awk,但是这并不回答你问的问题。)

原则上,您可以通过在awk中重新实现一个像strftime()这样的函数来重新发明轮子。 但那会是过度的。

如果你的系统有一个可用的GNU coreutils date命令,你可以从gawk调用它。 1960年1月1日的例子:

$ cat 1960.awk
#!/usr/bin/awk -f

BEGIN {
    timestamp = mktime("1960 00 00 00 00 00")
    print "mktime() returned " timestamp

    if (0) {
        # This doesn't work
        s = strftime("%Y-%m-%d %H:%M:%S", timestamp)
        print "strftime() returned ", s
    }
    else {
        # This works
        "date '+%Y-%m-%d %H:%M:%S' -d @" timestamp | getline t
        print "The date command printed "" t """
    }
}
$ ./1960.awk
mktime() returned -318355200
The date command printed "1959-11-30 00:00:00"
$

(我放弃了弄清楚在shell提示符下作为一行代码所需的引号和反斜杠序列。)

如果你有一个大型的awk程序,你可能需要添加这个特性。 但是如果你不想用awk来做这件事,你可能会考虑使用别的东西; awk可能不是你想要完成的工具的正确工具。

或者,如果你真的很有野心,你可以修改gawk来正确处理这个案例。


所以,这是一个错误...

我使用的是GNU awk 4.0.2,它是一个源代码,看起来很容易修复:

glaudiston:/sources/gawk-4.0.2$ diff builtin.c.orig builtin.c
1701,1702c1701,1702
<                       if (clock_val < 0)
<                               fatal(_("strftime: second argument less than 0 or too big for time_t"));
---
>                       // if (clock_val < 0)
>                       //      fatal(_("strftime: second argument less than 0 or too big for time_t"));
glaudiston:/sources/gawk-4.0.2$ echo "" | ./gawk '{ts="1969 12 31 23 00 00";format="%Y/%m/%d";tv=mktime(ts);print tv;print strftime(format, tv)}'
7200
1969/12/31
glaudiston:/sources/gawk-4.0.2$ echo "" | ./gawk '{ts="1960 01 01 00 00 00";format="%Y/%m/%d";tv=mktime(ts);print tv;print strftime(format, tv)}'
-315608400
1960/01/01

为我的目的,它的工作,但我不知道这是一个好主意。 我会将此发送给gawk maillist进行审批。

讨论开始于:https://lists.gnu.org/archive/html/bug-gawk/2015-04/msg00012.html

解决方案更新

awk开发团队修复了这个bug,所以只需将awk升级到新版本:

https://lists.gnu.org/archive/html/bug-gawk/2015-04/msg00036.html

链接地址: http://www.djcxy.com/p/84373.html

上一篇: awk with dates before 1970

下一篇: Sequelize orm vs Loopback orm