私がやろうとしているのは、最終的にスプレッドシートに保存されるWebページから、すべてのHTMLガンクなしで、映画のタイトルを解析して抽出することです。私のコード:
function myFunction() {
var url = UrlFetchApp.fetch("http://boxofficemojo.com/movies/?id=clashofthetitans2.htm")
var doc = url.getContentText()
var patt1 = doc.match(/<font face\=\"Verdana\"\ssize\=\"6\"><b>.*?<\/b>/i);
//var cleaned = patt1.replace(/^<font face\=\"Verdana\" size\=\"6\"><b>/,"");
//Logger.log(cleaned); Didn't work, get "cannot find function in object" error.
//so tried making a function below:
String.trim = function() {
return this.replace(/^\W<font face\=\"Verdana\"\ssize\=\"6\"><b>/,""); }
Logger.log(patt1.trim());
}
私はこれらすべて(プログラミングとGoogleScripting全般)に非常に慣れていません。w3school.comのJavaScriptセクションを参照していますが、そこにある多くのものはGoogleScriptsでは機能しません。ここに何が欠けているのかわかりませんが、正規表現は間違っていますか?RegExの代わりにこのデータを抽出するためのより良い/より速い方法はありますか?どんな助けでも素晴らしいでしょう、読んでくれてありがとう!