問題タブ [html-entities]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - いくつかの基本的な Python の質問
私は完全なパイソン初心者なので、ご容赦ください。Python で html のページをスキャンし、Microsoft Word エンティティのインスタンスを UTF-8 互換のものに置き換えたいと考えています。
私の質問は、Pythonでそれをどのように行うのですか(これをGoogleで検索しましたが、これまで明確な答えが見つかりませんでした)?私はPythonの水につま先を浸したいので、このような単純なものから始めるのが良いと思います. 私がする必要があるようです:
- MS Word から貼り付けたテキストを変数にロードする
- コンテンツに対して何らかの置換機能を実行します
- 出力する
PHP では、次のようにします。
Pythonでどのようにしますか?
編集: うーん、わかりました、UTF-8 とエンティティに関する私の混乱は今のところ無視してください。入力には、MS Word から貼り付けられたテキストが含まれています。カーリー クォートのようなものは、奇妙な記号として表示されます。試して修正するために使用したさまざまな PHP 関数では、必要な結果が得られませんでした。これらの奇妙なシンボルを 16 進エディタで表示すると、上記で使用したシンボル (0xe2、0x80 など) に対応していることがわかりました。そのため、私は単純に奇妙な文字を HTML エンティティに置き換えました。上記のビットが既に UTF-8 である場合、MS Word から何が貼り付けられ、奇妙なシンボルが表示されるのでしょうか?
EDIT2: そこで、Python について少し学び始めたところ、エンコーディングがよくわからないことがわかりました。私が解決しようとしていた問題は、端から端まで一貫性のあるエンコーディングを使用することで簡単に処理できます。入力フォームが UTF-8 の場合、入力を格納するデータベースは UTF-8 であり、それを出力するページは UTF-8 です... Word からの貼り付けは正常に機能します。特別な機能は必要ありません。さて、少しPythonを学ぶことについて...
python - Pythonでアポストロフィなどをエスケープ解除するにはどうすればよいですか?
私はこのような記号の文字列を持っています:
それはどうやらアポストロフィです。
運が悪かったのでsaxutils.unescape()を試し、urllib.unquote()を試しました
どうすればこれをデコードできますか?ありがとう!
php - PHP 関数 htmlspecialchars() に相当する Python はありますか?
Python に PHP 関数 htmlspecialchars() と同様または同等の関数はありますか? これまでに見つけた最も近いものは htmlentitydefs.entitydefs() です。
html - HTML番号から記号に変換する方法は?
しばらくインターネットを検索したところ、記号からHTML番号への変換を可能にするオンラインツールがたくさんあることがわかりましたが、その逆はできません。
HTML番号からシンボルに変換するためのツール/オンラインツール/PHPスクリプトを探しています
例えば:
その後に戻る
誰かがこれを知っていますか?
php - RSSフィードのコード
フィードクリエーター(具体的には、Kohanaのfeed :: create())を使用していますが、description要素のテキストの一部が次のようになっている場合があります
以下のコードを参照してください
<?php echo 'example'; ?>
フィード作成者はSimpleXMLライブラリを使用しています。データが(を使用して)返されるたびに$xml->asXml()
、description要素内のhtml山括弧がHTMLエンティティに変換されます。
これにより、タグが正しく解析され、pタグなどに役立ちます。ただし、この場合、PHPコードは表示されません(山かっこで囲まれています)。
私の質問は-RSSフィードでこのようなものをどのように表示できますか?>
それ自体が解析されたときにどのように表示でき<
ますか?それは理にかなっていますか?
出力されているものの例を次に示します。
(上記のエラーではないことに注意してください-エンティティはすべて変換されます)
(RSSリーダーで)表示したいのは
一部のコンテンツ
いくつかのコードで
php - なぜphpは引用符をmysqlのhtmlエンティティに変換できないのですか?
PHPはデフォルトで「魔法の引用符」を使用しますが、多くの問題があります。PHPの次のメジャーバージョンで無効になることを理解しています。
それに対する議論は理にかなっていますが、私が理解していないのは、スラッシュを削除して削除する代わりに、引用符を表すためにHTMLエンティティを使用しないのはなぜですか?結局のところ、mySQLのVASTの大部分はWebブラウザへの出力に使用されていますか?
たとえば、&#039; 'の代わりに使用され、データベースにはまったく影響しません。
別の質問ですが、PHPでこのタグ<?php4または<?php5を使用してPHPのバージョンごとに構成を設定できないので、これらのバージョンに適切なインタープリターをロードできるのはなぜですか?
ちょっと興味があるんだけど。:)
html-entities - なぜこの奇妙な文字エンコードが発生するのですか?
このHTMLソースコード:
次のように表示されます:'DIVISÃODEEDUCAÇÃOPR?ESCOLAREENSINOPRIMÁRIOO'
ええ、これらはいくつかのポルトガル語の文字です。なぜですかÃ
; Ãの略?
php - PHP の htmlentities ですが、html タグを保持します
文字列内のすべてのテキストを html エンティティに変換したいが、HTML タグは保持します。たとえば、次のようになります。
これに翻訳する必要があります:
何か案は?