0

たとえば、私のサイトはmysite.comです。このサイトのソースは次のとおりです。

<html>
<head>
<title>site</title>
//here is many javascript and css codes
</head>
<body>
<div>
<table border="1">
<tr>
  <td><a href="somthing.html">Here is a text</td>
  <td><img src="image.gif" alt="this is image"/></td>
</tr>
</table>
</div>
</body>
</html>

PHPを使用して、すべてのタグ(JavaScriptコード、リンク、テーブルなど)を含まないテキストと画像のみを取得するにはどうすればよいですか?「ここにテキストがあります」と「image.gif」だけを取得したいです。

4

1 に答える 1

2

ファイルがインターネット上にある場合は PHP cURL を使用しますfile_get_contents()。ファイルがローカル マシン上にある場合は、関数を使用できます。

余分なタグを取り除くには、次のコードを使用できます。

$contents - file_get_contents('file.html');
$contents = strip_tags( $contents, '<img>' ); //other than <img> you can specify more tags also

または、DOM アプローチも使用できます。

于 2012-07-23T12:31:03.340 に答える