これが私が達成しようとしていることです:
広い意味では、SAXパーサーを使用してXMLデータを解析し、MySQLテーブルの適切なデータベース列に挿入します。
これがサンプルですBooks.xml
<?xml version="1.0" encoding="UTF-8"?>
<!--Sample XML file generated by XMLSpy v2009 sp1 (http://www.altova.com)-->
<bks:books xsi:schemaLocation="urn:books Untitled1.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:bks="urn:books">
<book id="String">
<author>String</author>
<authorFirstName>String</authorFirstName>
<authorLastName>String</authorLastName>
<title>String</title>
<titleNo>3</titleNo>
<genre>String</genre>
<offer>String</offer>
<price>3.14159E0</price>
<pub_date>1967-08-13</pub_date>
<review>String</review>
<reviewsratings></reviewratings>
</book>
</bks:books>
SAXパーサーを使用するPerlスクリプト:
#!usr/bin/perl -w
use XML::SAX::ParserFactory;
use MySaxHandler;
my $handler = MySaxHandler->new();
my $parser = XML::SAX::ParserFactory->parser(Handler => $handler);
$parser->parse_uri("books.xml")
SAXパーサーハンドラーモジュールMySaxHandler.pm
:
package MySaxHandler;
use Data::Dumper;
use base qw(XML::SAX::Base);
my $in_books = 0;
sub start_document{
my($self,$data) = @_;
print "Parsing Started:\n";
}
sub start_element {
my ($self,$data) = @_;
my %attribs = %{$data->{'Attributes'}}; foreach( keys( %attribs )) { print " $_ = " . $attribs{$_}->{Value} . "\n"; } # -> Prints values of attributes.
print "Starting element: ".$data->{Name}."\n\t";
$in_books++;
}
sub end_element {
my($self,$data) = @_;
print "\t Ending element:".$data->{Name}."\n";
$in_books--;
}
sub characters{
my($self,$data) = @_;
if($in_productOffering){
print "\t Element Values:".$data->{Data}."\n";
}
}
sub end_document{
my($self,$data) = @_;
print "Parsing Completed\n";
}
1;
手順:
- XML::SAXパーサーを使用してXMLを解析する
- XML内のノードごとに、子ノードがある場合はそれをトラバースし、リーフノードに到達したら、そのノード値をデータベーステーブルの列に挿入するための挿入ステートメントを動的に生成します。たとえば、XMLリーフノードが
price
あり、その親ノードがであるoffer
場合、Perlスクリプトはデータベースのテーブルの列にprice
ノードの値を挿入する必要があります。price
offer
- 多くのノードを持つ大きなXMLファイルがあり、各ノードには多くの子ノードと孫ノードがあります。
質問:
for. E.g. price value should go into offer table's price column
SAXパーサーを使用してXMLを解析しているときに、books.xmlの要素タグの値を適切なMySQLデータベース列に挿入するにはどうすればよいですか?OR
どうすればすべての挿入を生成できますか?すべての挿入ステートメントを取得したら、MySQLデータベースに接続してそれらをダンプするだけですか?
トリッキーな部分:
トリッキーな部分は、相互依存性のあるデータがいくつかあることです。たとえばprice
、offer
親ノードのノードもノードに関連してdefault price
いるため、挿入ステートメントを生成する際には、値がデータベースに適切に挿入されることに注意する必要がありますが、MySQLのInnoDBテーブルを使用することは許可されていませんが、許可されている唯一のエンジンです。使用はMyISAMです。
これらの問題を回避するためにPerlで可能な提案は何ですか?