0

SimpleHTMLDomParserを使用して、html コードを調べてさまざまなものを見つけています。これまでのところすべて正常に動作していますが、1 つ問題があります。

ID、クラス、一意の親要素を持たない文字列を見つけるにはどうすればよいですか?

私の場合、div からコンテンツを抽出することから始めました。

$descrs    = $html->find('.show_synopsis');

foreach($descrs as $descr) { 

    echo($descr->innertext);

}

これは次のようになります。

<div class="show_synopsis">

    Lorem ipsum dolor sit amet, consetetur sadipscing elitr. <b>Source:</b> LORES.

</div>

LORESさて、上記の例から検索して削除することは可能ですか?

は変数であり、変化する可能性があるためLORES、常に次の単語を見つけることができるかどうか疑問に思っていました<b>Source:</b>?

私はいくつかの異なる方法を試しましたが、今のところうまくいきませんでした。この投稿のソリューションを適応させようとしましたが、ニーズに合わせて調整できませんでした。

4

2 に答える 2

2

これを試して:

echo preg_replace('/(.?)<b>.*Source:.*<\/b>.*\./', '$1', $descr->innertext);
于 2012-05-10T17:41:36.773 に答える
1

エコーしている文字列のLORESを置き換えることはできませんか?

echo str_replace('LORES', '', $descr->innertext);
于 2012-05-10T17:06:24.090 に答える