3

I'm trying to neaten up a large data structure in Perl which was read in from JSON. Two stereotypical elements look like this (in JSON):

[
    [ [ {'payload':'test'} ], [ [ {'payload':'reply'} ], [] ] ],
    [ [ {'payload':'another thread'} ] 
]

I want to completely remove that empty arrayref at the bottom of that element, and replace each arrayref containing only a single hashref by the contained hashref. In other words, the result should be this:

[
    [ {'payload':'test'}, [ {'payload':'reply'} ] ],
    [ {'payload':'another thread'} ]
]

Currently my code is as follows:

use v5.12;
use strict;
use warnings;
use JSON::XS;
use Data::Walk;

sub cleanup {
    if (ref $_ eq 'ARRAY') {
        if (scalar(@{$_}) == 0) {
            die 'mysteriously I never reach this branch!';
            while (my ($key,$value) = each @{$Data::Walk::container}) {
                if ($value == $_) {
                    delete ${$Data::Walk::container}[$key]
                }
            }
        } elsif (scalar(@{$_}) == 1 and ref @{$_}[0]) {
            $_ = @{$_}[0];
        } else {
            my $tail = ${$_}[scalar(@{$_})-1];
            if (ref $tail eq 'ARRAY' and scalar(@{$tail}) == 0) {
                $#{$_}--;
            }
        }
    }
}

sub get {
    my $begin = shift;
    $begin = 0 unless $begin;
    my $end = shift();
    $end = $begin + 25 unless $end;
    my $threads;
    {
        local $/;
        open(my $f, '<emails.json');
        $threads = decode_json <$f>;
        close($f);
    }
    $threads = [ @{$threads}[$begin .. $end] ];
    walkdepth(\&eliminate_singleton, $threads);
    return $threads;
}

print JSON::XS->new->ascii->pretty->encode(&get('subject:joke'));

and though it succeeds in removing the empty arrayref, it fails to collapse the singletons. How can this code be corrected such that it can collapse the singletons?

4

1 に答える 1

0

配列の要素である空の配列を削除したいのはわかりますが、各シングルトン arrayref をその要素への参照に置き換えることは理解できません。おそらく、単一要素の配列である各ハッシュ値をその内容で置き換えるつもりですか?

そう

[
  "data1",
  [],
  "data3",
]

に変換されます

[
  "data1",
  "data3",
]

{
  "key1" : ["val1", "val2"],
  "key2" : ["val3"],
  "key3" : ["val4", "val5"],
}

に変換されます

{
  "key1" : ["val1", "val2"],
  "key2" : "val3",
  "key3" : ["val4", "val5"],
}

あなたのプログラムでは、後者は に"tags" : ["inbox"]なることに対応し"tags" : "inbox"ます。

その場合、このバージョンのeliminate_singletonはあなたが望むことを行います。

コンテナー ノードからビューを取得し、内部の変更が必要かどうかを確認します。ノード自体の観点からこれを行うと、ノードがスキャンされている間にノードが変更され、プログラムが中断する可能性があります。そのままでは、配列の末尾から後方へのループは、未訪問のノードを削除しないため安全です。

use Scalar::Util 'reftype';

sub eliminate_singleton {

  my $node = $_;
  my $type = reftype $node // '';

  if ($type eq 'ARRAY') {
    for (my $i = $#$node; $i >= 0; $i--) {
      my $subnode = $node->[$i];
      my $subtype = reftype($subnode) // '';
      delete $node->[$i] if $subtype eq 'ARRAY' and @$subnode == 0;
    }
  }
  elsif ($type eq 'HASH') {
    for my $k (keys %$node) {
      my $subnode = $node->{$k};
      my $subtype = reftype($subnode) // '';
      if ($subtype eq 'ARRAY' and @$subnode == 1) {
        $node->{$k} = $node->{$k}[0];
      };
    }
  }
}
于 2012-06-26T18:25:07.147 に答える