php - Web サイトのタイトルを取得してウムラウトを変換する

Question

小さなスニペットを使用しての内部テキスト<title>を取得し、Web サイトのタイトルを取得します。これは非常にうまく機能します。しかし、ウムラウトやその他の html 文字には問題があります。最初はを使ってみhtmlentities()たのですが、ウェブサイトのウムラウトの埋め込み方はいろいろあるので、かなり複雑になってきました。

たとえば、最新のブラウザーでは、ソースコード lik にプレーンテキストとして記述しても問題ありませんが、古いブラウザーもサポートするä ö üために、それらを html エンティティとして使用したいと考えています。ä ö ü

というわけで、本当の問題は、このタイトルのように両方が混在している場合です (ソースコード) Pläne: Alkoholverbot für 18-Jährige? > Online Zeitung。

使用しようとするとhtmlentities()、結果はPläne: Alkoholverbot für 18-Jährige? &gt; Online Zeitung. になる " > " を除いて、すべてがうまく変換されます&gt;。

メソッドを使用するstr_replace()必要がありますか、または混合 html エンティティを処理するための他のベストプラクティスはありますか?

どうも

score 1 · Accepted Answer

最初にを使用してすべてのエンティティを Unicode 表現にデコードしhtml_entity_decode()、次に文字列をに渡してhtmlentities()すべてを再度エンコードします。

php - Web サイトのタイトルを取得してウムラウトを変換する

1 に答える 1

Related

Reference