小さなスニペットを使用して の内部テキスト<title>
を取得し、Web サイトのタイトルを取得します。これは非常にうまく機能します。しかし、ウムラウトやその他の html 文字には問題があります。最初は を使ってみhtmlentities()
たのですが、ウェブサイトのウムラウトの埋め込み方はいろいろあるので、かなり複雑になってきました。
たとえば、最新のブラウザーでは、ソースコード lik にプレーンテキストとして記述しても問題ありませんが、古いブラウザーもサポートするä ö ü
ために、それらを html エンティティとして使用したいと考えています。ä ö ü
というわけで、本当の問題は、このタイトルのように両方が混在している場合です (ソース コード) Pläne: Alkoholverbot für 18-Jährige? > Online Zeitung
。
使用しようとするとhtmlentities()
、結果はPläne: Alkoholverbot für 18-Jährige? &gt; Online Zeitung
. になる " > " を除いて、すべてがうまく変換されます&gt;
。
メソッドを使用するstr_replace()
必要がありますか、または混合 html エンティティを処理するための他のベスト プラクティスはありますか?
どうも