2

たくさんの文書からいくつかの文を置き換える必要があります。すべての文はほぼ同じですが、一部のドキュメントでは、区切り、欠落、または追加された単語/文字があります。最初と最後の単語を一致させようとしましたが、正確ではありません。

ほぼ一致する文を置き換える方法はありますか、または誰かが考えていますか?

次の文を置き換えたいとしましょう。

Lorem ipsum dolor sit amet、consetetur sadipscing elitr、sed diam nonumy eirmod tempor invidunt

これが休憩のある文です

Lorem ipsum dolor sit amet、consetetur sadipscing elitr、
sed diam nonumy eirmod tempor invidunt

欠落しているコンマ

Lorem ipsum dolor sit amet、consetetur sadipscing elitr
sed diam nonumy eirmod tempor invidunt

そして欠けている言葉

Lorem ipsum dolor sit amet sadipscing elitr、sed diam nonumy invidunt
4

1 に答える 1

1

テストされていませんが、similar_text(); を確認してください。

    <?php
$threshold = 80; //Percentage threshold
    $par1 = "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt";
    $par2 = "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
    sed diam nonumy eirmod tempor invidunt";

    $percent = similar_text($par1,$par2);
    if ($percent < $threshold) {
        //Correct the incorrect paragraph
        $par2 = $par1;
    }
    ?>
于 2013-01-15T12:15:47.460 に答える