0

一部のテキストを自動的に解析できるツールを作成したいと思います。JavaScriptと正規表現を使用しています。

たとえば、私はこのテキストを持っています:

Aa Aaa 1, Bb Bbb 2  and Cc Ccc 1
1 Institut xx Xx, Some University, Xxxx 14, US-10000 NewYork, USA; E-Mails: aa.aaa@edu.com; cc.ccc@edu.com
2 Institut zz Zzz, Some University2, Zzzz 20, US-10000 NewYork, USA; E-Mail: bb.bbb@edu.com

そして、私はそれらの情報を解析したいと思います

各作成者(FirstNameおよびLastName)の場合:

  • 所属
  • メールアドレス

したがって、私の例では、次のようにします。

Aa Aaa - Institut xx Xx, Some University, Xxxx 14, US-10000 NewYork, USA - aa.aaa@edu.com

Bb Bbb - Institut zz Zzz, Some University2, Zzzz 20, US-10000 NewYork, USA - bb.bbb@edu.com

Cc Ccc - Institut xx Xx, Some University, Xxxx 14, US-10000 NewYork, USA - cc.ccc@edu.com

非常に複雑に見えるので、質問をいくつかの簡単な質問に分けるべきだと思う場合は、私に知らせてください。

ありがとうございました。

4

1 に答える 1

1

それは実行可能なタスクです。

私はJavaScriptでコーディングしていませんが、SOの誰かが次のPerlコードのクローンを作成してくれることを願っています。

$_ = "\n\n" . $input;
1 while s/^(.*?\n?)\n{1,2}\s*([^\d]+)\s+(\d+)\s*?(?:\s*and|[,\n\s])(.*?)(?<=\n)(\3\s+)([^\n]*)(\n.*$|$)/$1$2 - $6\n\n$4$5$6$7/gs;
s/\n\n.*$//s;
print $_;

こちらのPerlコードを参照してテストしてください。

于 2012-06-29T14:46:44.013 に答える