おそらく、エンコーディングが切り替わるデータ バッファー内のポイントを指定するために、ありそうもない区切り文字を使用することができます。これにより、解析関数は、別の方法で処理する必要があるファイルのチャンクを識別できます。
アラビア語のテキストが UTF-8 文字を使用しているかどうかはわかりません。英語とアラビア語の両方で必要なすべての文字を UTF-8 でレンダリングできることを願っています。次に、区切り文字を使用して、動作が異なるテキストの断片を処理する方法を他のコードに指示できます。
>some english/L-T-R markup
Ⓐ**...markup R-T-L Some**كل الخارجي للنص أو شكل توضع الفقرات في الصفحة التي يقرأها. ولذلك يتم استخدام طريقة لوريم إيبسوم لأنها تعطي توزيعاَ طبيعياَ -إلى حد ما- للأحرف عوضاً عن استخدام "هنا يوجد محتوى نصي، هنا يوجد محتوى نصي" فتجعلها تبدو (أي الأحرف) وكأنها نص مقروء. العديد من برامح النشر المكتبي وبرامح تحرير صفحات الويب تستخدم لوريم إيبسوم بشكل إفتراضي كنموذج عن اⒶ
正規表現についてはわかりませんが、アラビア語と英語の混合正規表現を既に処理するライブラリが github にあることを願っています :)
編集: スタック オーバーフローのマークダウンは、初めていくつかのものを食べました (そして、神はそれが私の貼り付けたアラビア語の lorem ipsum に何をしたかを知っています)
編集:ここからアラビア語のタグを探し始めます
var src = "try to write javascript that replaces <رابط>نص تجريبي</رابط> by <a href='#'>نص تجريبي</a> and you wil notice all the difficulties – user2080105 15 mins ago"
var a = src.match(/try/);
console.log(a);
var b = src.match(/<[^>]*>/);
console.log(b);
var c = src.match(/<\/?[^>]*>/g);
console.log(c);
//Output in node v0.9.4-pre
[ 'try',
index: 0,
input: 'try to write javascript that replaces <رابط>نص تجريبي</رابط> by <a href=\'#\'>نص تجريبي</a> and you wil notice all the difficulties – user2080105 15 mins ago' ]
[ '<رابط>',
index: 38,
input: 'try to write javascript that replaces <رابط>نص تجريبي</رابط> by <a href=\'#\'>نص تجريبي</a> and you wil notice all the difficulties – user2080105 15 mins ago' ]
[ '<رابط>', '</رابط>', '<a href=\'#\'>', '</a>' ]