JAVAでドメイン名だけをパースしたい。例えば、
http://facebook.com/bartsf
http://www.facebook.com/pages/Shine-Communications/169790283042195
http://graph.facebook.com/100002306245454/picture?width=150&height=150
http://maps.google.com/maps?hl=en&q=37.78353+-122.39579
http://www.google.com/url?sa=X&q=http://www.onlinehaendler-news.de/interviews/1303-abba24-im-spagat-zwischen-haendler-und-kaeuferinteressen.html&ct=ga&cad=CAEQARgAIAAoATABOAFAnqSQjwVIAVAAWABiAmRl&cd=xa_cHWHNG70&usg=AFQjCNFMgnkzqN0fNKMFKz1NTKK1n9Gg9A
これがマップ削減コードを書いている私のコードです。
String[] whiteList={"www.facebook.com","www.google.com"};
UrlValidator urlValidator=new UrlValidator(schemes);
Readfile line by line
for line in file
{
String sCurrentLine=line;
if(sCurrentLine.length()>=3)
{
String tempString=sCurrentLine.substring(0,3);
if(!tempString.equals("192") && !tempString.equals("172") && !tempString.equals("10."))
{
sCurrentLine="http://"+sCurrentLine;
if(urlValidator.isValid(sCurrentLine))//domain filter should be here
{
System.out.println(sCurrentLine);
}
}
tempString="";
}
}
ドメイン名が facebook.com または google.com のいずれかであり、上記のすべての URL が除外されるかどうかをフィルタリングしたい。