だから私は41段落のドキュメントを循環しています。段落ごとに、最初に文字列を配列に分割し、次に段落の単語頻度を取得しようとしています[1]。次に、すべての段落のデータを組み合わせて、ドキュメント全体の単語の頻度を取得します。
特定の段落の「単語」とその「頻度」を示す配列を取得できますが、各段落の結果をマージして「ドキュメント全体の単語頻度」を取得するのに問題があります。これが私が持っているもの:
function sectionWordFrequency($sectionFS)
{
$section_frequency = array();
$filename = $sectionFS . ".xml";
$xmldoc = simplexml_load_file('../../editedtranscriptions/' . $filename);
$xmldoc->registerXPathNamespace("tei", "http://www.tei-c.org/ns/1.0");
$paraArray = $xmldoc->xpath("//tei:p");
foreach ($paraArray as $p)
{
$para_frequency = (array_count_values(str_word_count(strtolower($p), 1)));
$section_frequency[] = $para_frequency;
}
return array_merge($section_frequency);
}
/// now I call the function, sort it, and try to display it
$section_frequency = sectionWordFrequency($fs);
ksort($section_frequency);
foreach ($section_frequency as $word=>$frequency)
{
echo $word . ": " . $frequency . "</br>";
}
今私が得る結果は次のとおりです。
1:アレイ2:アレイ3:アレイ4:アレイ
どんな助けでも大歓迎です。