1

ここに種のリストがあります:

http://megasun.bch.umontreal.ca/ogmp/projects/other/compare.html

そしてここに種のリスト:

http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=3524

両方のページに記載されているすべての種を見つけたいと思います。どうすればこれをすばやく行うことができますか? (種に言及していない単語が見つかってもかまいません。一般的な単語の比較を行いたい:)

提案をありがとう。

4

1 に答える 1

1

コンソールの各ページで、次の操作を行います。

var html = document.body.innerHTML;
results = [];
html.match(/>([^<]+?)</g)               // grab all values like ">...<"
    .map(function(match) {              // look for a long words..words..words
        return match.match(/\w.*\w/);
    })
    .filter(function(match) {           // ignore empty matches
        return match!==null
    })
    .forEach(function(match) {
        var text = match[0];
        if (!text.match(/[0-9]/) &&     // ignore matches with numbers
            results.indexOf(text)==-1)  // add to results if not duplicate
            results.push(text);
    });
JSON.stringify(results);

次に、次のようにします。

var page1 = JSON.parse(' /*COPY-PASTE THE RESULT OF PAGE 1*/ ');
var page2 = JSON.parse(' /*COPY-PASTE THE RESULT OF PAGE 2*/ ');
page1.map(function(s){return page2.indexOf(s)!=-1});

これは、ブラウザの制限を回避するために必要です。

デモ:

> JSON.stringify( page1.filter(function(s){return page2.indexOf(s)!=-1}) )
'["Beta vulgaris","Spinacia oleracea"]'
于 2012-05-22T15:45:44.860 に答える