なるほどなぁ。以下、自分的要約:
- One True AWK (nawk) が UTF8 と CSV (by
--csv
オプション)に対応 1 - UTF8 専用になってしまっており、
LC_ALL=C
への対応が一時的になくなった - おまけ Miller (mlr) 使えばよくね?
自分はもう nawk とか使う機会はないので… 生暖く見守っていきましょう。
awk といえば、前にこんな記事も zenn.dev に書きました。
二重引用符の個数が奇数だったらセルが閉じてないから、次の行を連結するという簡単なロジックで要素内の改行コードに対応する方式ですわ。が、gawk や goawk も --csv
に対応するみたいなので、もう要らなくなりそう
- 二重引用符で囲まれた範囲内の列区切り文字、行区切り文字は要素の一部とみなすという対応。今まで FPAT という変数を使えば列区切り文字問題は対応できていたが、行区切り文字はどうしようもなかった。対応しない理由としては、そこまでするならもっと別のツールを使うべきだとかいう回答だったのだが…確かに今更どないしたのという感じではある↩