PHP多维数组:用两个值连接替换所有的键

我在PHP中有一个多维数组,其中外部数组包含数千个项目,其中的每个项目都是一个数组本身,其值为“key1”,“key2”和“count”:

 myExistingArray (size=99999 VERY BIG)
      public 0 => 
        array (size=3)
          'key1' => string '15504' 
          'key2' => string '20'
          'count' => string '1'
      public 1 => 
        array (size=3)
          'key1' => string '15508' (length=5)
          'key2' => string '20' (length=2)
          'count' => string '2' (length=1)
      public 2 => 
        array (size=3)
          'key1' => string '15510' (length=5)
          'key2' => string '20' (length=2)
          'count' => string '5' (length=1)
....many more similar items

我想将它转换成一个非常简单的数组,其中来自“key1”和“key”的前一个值被连接成一个新的键,指向corressponding的“count”值,如下所示:

  myNewArray (size=99999 VERY BIG)
      <key1>_<key2> => <count>
      15504_20 => string '1' (length=1)
      15508_20 => string '2' (length=1)
      15510_20 => string '5' (length=1)

性能对我来说非常重要,因为外部阵列有几千个项目。 PHP中有快速方法吗? 我唯一得到的只是一个简单的迭代,但是这对我来说似乎很慢:

// works but I am looking for a faster version
$myNewArray = array();
foreach ($myExistingArray as $item) {
  $myNewArray [$item["key1"]."_".$item["key1"]]=$item["count"];
}

编辑/潜在问题

有些人理所当然地补充说我现在的解决方案已经在O(n)中,并且提到PHP中没有内置函数来加速这一过程。

我从mysql数据库查询中获得“myExistingArray”。 我基本上有工作对象,并希望按他们的状态和他们的event_id分组。 查询与此类似:

select count(job.id) as count, job.status as key1, job.event_id as key2
from job
group by job.status, job.event_id

我想重新排列键,以便稍后我可以轻松访问具有某种状态的某个事件的作业计数。


通常,你会寻找array_walk或者array_map函数来转换PHP中的数组,但不幸的是,它们都不能改变你想要转换的数组的键。 array_walk将保留键,但不会改变它们。 很遗憾,不,没有内建的功能来完成你所要求的功能。


用下面的结果做几个测试(几乎都是一样的)。

Test 1:  [0.25861501693726]
Test 2:  [0.20804476737976]
Test 3:  [0.21039199829102]
Oldskool:[0.26545000076294]
Test 4:  [0.35072898864746]

在合并的数组上执行var_dump()会减慢速度(如预期的那样),但是如果保留它的内存,数据不会太糟。

和PHP用于测试:

// Construct the raw data
$i = 0;
do {
    $raw[] = array('key1' => mt_rand(10000,99999), 'key2' => mt_rand(10,99), 'count' => $i);
} while(++$i < 100000);

// Test 1
$before = microtime(true);
foreach($raw as $k => $v) {
    $clean[$v['key1'].'_'.$v['key2']] = $v['count'];
}
$after = microtime(true);
echo 'Test 1:['.($after - $before).']<br />';

$clean = false;
$i = 0;

// Test 2
$before = microtime(true);
$max = count($raw);
do {
    $clean[$raw[$i]['key1'].'_'.$raw[$i]['key2']] = $raw[$i]['count'];
} while(++$i < $max);
$after = microtime(true);
echo 'Test 2:['.($after - $before).']<br />';

$clean = false;
$i = 0;

// Test 3
$before = microtime(true);
$max = count($raw);
for($i; $i < $max; $i++) {
    $clean[$raw[$i]['key1'].'_'.$raw[$i]['key2']] = $raw[$i]['count'];
}
$after = microtime(true);
echo 'Test 3:['.($after - $before).']<br />';

$clean = false;

// Test of Oldskool's suggestion
$before = microtime(true);
foreach (array_keys($raw) as $item) {
    $clean[$raw[$item]['key1'].'_'.$raw[$item]['key2']] = $raw[$item]['count'];
}
$after = microtime(true); 
echo 'Test Oldskool:['.($after - $before).']<br />';

$clean = false;
$i = 0;

// Test 4, just for fun
$before = microtime(true);
$max = count($raw);
do {
    $c = array_pop($raw[$i]);
    $clean[join('_', $raw[$i])] = $c;
} while(++$i < $max);
$after = microtime(true);
echo 'Test 4:['.($after - $before).']<br />';

编辑 :为Oldskool示例添加了一个测试。


你可以改变你的foreach只遍历键而不是整个子数组,通过改变它:

foreach (array_keys($myExistingArray) as $item) {
    $myNewArray[$myExistingArray[$item]['key1'] . '_' . $myExistingArray[$item]['key2']] = $myExistingArray[$item]['count'];
}

这会让你获得一些轻微的速度优势(参见这里的时间比较(array_keys方法)和这里(你的原始方法))。 在非常大的阵列上,差异可能会变得更加明显。

链接地址: http://www.djcxy.com/p/35741.html

上一篇: PHP multidimensional array: replace all keys with concatenation of two values

下一篇: LSTM example to time series prediction via MXNet in R