3

私はそれについてグーグルで調べましたが、それらのほとんどは、TinyMCE が JavaScript パースペクティブにある Word スタイルを貼り付けないようにすることに関するものです。

私の問題は、データが既にデータベース(MySQL) にあり、ユーザーが TinyMCE を介して MS Words テキストを貼り付けて作成したすべての書式設定と共にあることです。

PHPを使用してすべての書式設定を削除し、テキストのみを保持する方法はありますか?

いくつかのサンプル テキスト:

&lt;!--  /* Font Definitions */  @font-face     {font-family:"Cambria Math";    panose-1:2 4 5 3 5 4 6 3 2 4;   mso-font-charset:1;     mso-generic-font-family:roman;  mso-font-format:other;  mso-font-pitch:variable;    mso-font-signature:0 0 0 0 0 0;} @font-face     {font-family:Calibri;   panose-1:2 15 5 2 2 2 4 3 2 4;  mso-font-charset:0;     mso-generic-font-family:swiss;  mso-font-pitch:variable;    mso-font-signature:-1610611985 1073750139 0 0 159 0;}  /* Style Definitions */  p.MsoNormal, li.MsoNormal, div.MsoNormal    {mso-style-unhide:no;   mso-style-qformat:yes;  mso-style-parent:"";    margin-top:0in;     margin-right:0in;   margin-bottom:10.0pt;   margin-left:0in;    line-height:115%;   mso-pagination:widow-orphan;    font-size:11.0pt;   font-family:"Calibri","sans-serif";     mso-ascii-font-family:Calibri;  mso-ascii-theme-font:minor-latin;   mso-fareast-font-family:Calibri;    mso-fareast-theme-font:minor-latin;     mso-hansi-font-family:Calibri;  mso-hansi-theme-font:minor-latin;   mso-bidi-font-family:"Times New Roman";     mso-bidi-theme-font:minor-bidi;     mso-fareast-language:EN-US;} .MsoChpDefault     {mso-style-type:export-only;    mso-default-props:yes;  mso-ascii-font-family:Calibri;  mso-ascii-theme-font:minor-latin;   mso-fareast-font-family:Calibri;    mso-fareast-theme-font:minor-latin;     mso-hansi-font-family:Calibri;  mso-hansi-theme-font:minor-latin;   mso-bidi-font-family:"Times New Roman";     mso-bidi-theme-font:minor-bidi;     mso-fareast-language:EN-US;} .MsoPapDefault     {mso-style-type:export-only;    margin-bottom:10.0pt;   line-height:115%;} @page Section1   {size:8.5in 11.0in;     margin:1.0in 1.0in 1.0in 1.0in;     mso-header-margin:.5in;     mso-footer-margin:.5in;     mso-paper-source:0;} div.Section1   {page:Section1;} --&gt;   Blah blah blah blah blah &nbsp;    </p>

注: HTML エンティティとしてデータベースに格納される HTML タグ (たとえば、文字<は として格納されます&lt;)

4

1 に答える 1

1

あなたがしたいことは、HTML をプレーンテキストに変換することです。それは基本的に TinyMCE から得られるものであり、データベースに挿入したいものです。

これを行う簡単な方法は、既に述べたように、strip_tagsonhtmlspecialchars_decode関数を使用することです。ただし、人事要素など、重要な情報が削除される可能性があります。使用する可能性が高いのは、変換をより正確にするいくつかの追加機能を備えた非常に簡単なクラスであるhtml2textです。

それが役に立てば幸い!

于 2013-01-31T10:30:47.630 に答える