私の目標は、次のサイトの「アゴニスト」、「アンタゴニスト」、および「アロステリック レギュレーター」というタイトルの表からリンクを抽出することです。
http://www.iuphar-db.org/DATABASE/ObjectDisplayForward?objectId=1&familyId=1
HTML::TableExtract を使用してテーブルを抽出しましたが、問題のリンクを取得するために HTML::LinkExtor を取得できませんでした。これが私がこれまでに持っているコードです:
use warnings;
use strict;
use HTML::TableExtract;
use HTML::LinkExtor;
my @names = `ls /home/wallakin/LINDA/ligands/iuphar/data/html2/`;
foreach (@names)
{
chomp ($_);
my $te = HTML::TableExtract->new( headers => [ "Ligand",
"Sp.",
"Action",
"Affinity",
"Units",
"Reference" ] );
my $le = HTML::LinkExtor->new();
$te->parse_file("/home/wallakin/LINDA/ligands/iuphar/data/html2/$_");
my $output = $_;
$output =~ s/\.html/\.txt/g;
open (RESET, ">/home/wallakin/LINDA/ligands/iuphar/data/links/$output") or die "Can't reset";
close RESET;
#open (DATA, ">>/home/wallakin/LINDA/ligands/iuphar/data/links/$output") or die "Can't append to file";
foreach my $ts ($te->tables)
{
foreach my $row ($ts->rows)
{
$le->parse($row->[0]);
for my $link_tag ( $le->links )
{
my %links = @$link_tag;
print @$link_tag, "\n";
}
}
}
#print "Links extracted from $_\n";
}
このサイトの別のスレッド ( HTML テーブルからの Perl 解析リンク ) のサンプル コードを使用してみましたが、役に立ちませんでした。解析の問題なのかテーブル認識の問題なのかわかりません。提供されたヘルプは大歓迎です。ありがとう!