ほぼ 30000 レコードの非常に大きな JSON ファイルがあります。1 つのレコードは次のようになります。
{
"adlibJSON": {
"recordList": {
"record": [
{
"@attributes": {
"priref": "4372",
"created": "2011-12-09T23:09:57",
"modification": "2012-08-11T17:07:51",
"selected": "False"
},
"acquisition.date": [
"1954"
],
"documentation.title": [
"A lot of text with a lot of extra double quotes like "this" and "this""
] ... ...
問題は、余分な二重引用符を含む多くの値があることです。これは 1 つの二重引用符にすることができますが、2 つまたは 3 つの追加の二重引用符にすることもできます。"documentation.title"
私の例での値を参照してください。
これらの引用符をすべて見つけて正規表現に置き換えるにはどうすればよいですか。崇高なテキスト 2 を使用して正規表現を実行していますが、この特定の問題を解決する方法がわかりません。