URL から Excel ファイルを読み取り、そのデータを取得する必要があります。ファイルの名前は companies.xls ですが、メモ帳でこのファイルを開くと、HTML に埋め込まれた xls のようなものが見つかりました。Microsoft Excel は問題なくこのファイルを開き、このファイルを xls 拡張子で保存できますが、プログラムで保存するか、このファイルを読み取る他の方法を見つける必要があります。このファイルのデータを読み取るにはどうすればよいですか? 純粋な xslt Apache poi ファイル システムではないため、以下のエラーが発生します。
java.io.IOException: Invalid header signature; read 0x6D78206C6D74683C, expected 0xE11AB1A1E011CFD0
これが私のコードです。
URL companyList= new URL("someURL.xslt");
InputStream inputStream = companyList.openStream();
POIFSFileSystem fs = new POIFSFileSystem(inputStream);
xls ファイルまたは html;
<head>
<meta http-equiv=Content-Type content="text/html; charset=Windows-1254">
<meta name=sssId content=Excel.Sheet>
<style type="text/css">
body,table,tr,th,td {font-family:Arial;font-size:11pt;color:#000;}
.th {padding:3em;background:#3366FF;text-align:center;color:#ffffff;}
.td {padding:2em;background:#ffffff;}
</style>
<!--[if gte mso 9]><xml>
<x:ExcelWorkbook>
<x:ExcelWorksheets>
<x:ExcelWorksheet>
<x:Name>Companies</x:Name>
<x:WorksheetOptions>
<x:DefaultRowHeight>285</x:DefaultRowHeight>
<x:FreezePanes/>
<x:FrozenNoSplit/>
<x:SplitHorizontal>1</x:SplitHorizontal>
<x:TopRowBottomPane>1</x:TopRowBottomPane>
<x:ActivePane>2</x:ActivePane>
<x:Panes>
<x:Pane>
<x:Number>3</x:Number>
</x:Pane>
<x:Pane>
<x:Number>2</x:Number>
</x:Pane>
</x:Panes>
</x:WorksheetOptions>
</x:ExcelWorksheet>
</x:ExcelWorksheets>
</x:ExcelWorkbook>
</xml><![endif]-->
</head>
<body>
<table width="100%" border="1">
<tr><th width="85%" class="th">Company Nameı</th><th width="15%" class="th">City</th></tr>
<tr><td width="100%" class="td">Microsoft</td><td width="100" align="center" class="td" nowrap>sValley</td> </tr>
<tr><td width="100%" class="td">Google</td><td width="100" align="center" class="td" nowrap>london</td></tr>
....