特殊文字のジャンクアップされたデータ(いくつかを許可)をクリーンアップしようとしていますが、それでも成功するものもあります。以前に正規表現スニペットを見つけましたが、アスタリスクなどの一部の文字は削除されません。
$clean_body = $raw_text;
$clean_title = preg_replace("/[^!&\/A-Za-z0-9_ ]/","", $clean_body);
$clean_title = substr($clean_title, 0, 64);
$clean_body = nl2br($clean_body);
if ($nid) {
$node = node_load($nid);
unset($node->field_category);
} else {
$node = new stdClass();
$node->type = 'article';
node_object_prepare($node);
}
$split_title = str_split($clean_title);
foreach ($split_title as $key => $character) {
if ($key > 15) {
if ($character == ' ' && !preg_match("/[^!&\/,.-]/", $split_title[$key - 1])) {
$node->title = html_entity_decode(substr(strip_tags($clean_title), 0, $key - 1)) . '...';
}
}
}
最初の部分は、通常の句読点や英数字ではない生のテキスト内のすべてをクリーンアップしようとします。次に、タイトルを配列に分割し、スペースを探します。私がやりたいのは、15文字以上の長さのタイトルを作成し、句読文字で停止することなく、スペースで切り捨てる(単語全体をそのままにする)ことです。これは私が問題を抱えている部分です。
一部のタイトルは、最初のタイトルに'が含まれていてはならず、セクションがたとえばである場合でも、*****************
またはとして表示されます。** HOW TO MAKE $$$$$$ BLOGGING **
*
HOW TO MAKE...