始める前に、はい、私が説明しようとしているすべてが裏返しであることを知っていますが、現時点ではそれが私が取り組まなければならないものです.
私の組織は Cognos 10 BI の実装の真っ最中です。現在、データ キューブで大きなパフォーマンスの問題が発生しており、アドホックな方法でデータをスライスするエンド ユーザーの能力を著しく妨げています。歴史的には、SAP からの大規模なデータ抽出を使用し、ms-access で操作して、エンド ユーザーが Excel でピボットできるように毎日更新されるデータ ソースを提供していました。
これはトランザクション データではないため、50 万件を超えるレコードはなく、パフォーマンスが問題になることはありませんでした。
私たちの実装チームは、静的なビューとレポートを提供するために使用できる機能するデータ キューブを管理者に提供できなかったため、Cognos データ抽出を使用して古いシステムを一時的に再作成する任務を負っています。
私が直面している問題は、ランダムに、週に 3 回、次の週に 1 回、ファイルに解析不能なレコードが含まれることです。ファイルを再ダウンロードでき、2 回目または 3 回目は正常に機能するため、特殊文字の問題であるとは思えません。
誰かが似たような経験をしたことがありますか?Cognos が提供するデータ セットがこの目的のために設計されていないことは認識していますが、ファイルの 20% に破損が含まれているのは奇妙に思えます。また、奇妙なことに、ダウンロード形式として .xls スプレッドシートを選択すると、拡張子が .xls に変更された Unicode テキスト ファイルのように見えます。
任意の洞察をいただければ幸いです。
編集:ファイルの比較は次の実験になります。バイトごとに比較できますが、あるファイルでは解析できないが、次のファイルでは解析できる特定のレコードを比較しましたが、違いは見つかりませんでした。
インポートに関しては、手動でファイルを Unicode テキストに変換し、その形式からインポートします。