0

これをどのように表現するかは完全にはわかりませんが、いくつかのフレーズを検索しましたが、必要なものが見つかりませんでした.

データベースに入れる必要がある非構造化データが大量にあります。以前は、Needlebase で面倒な作業を行って、そこからデータをクリーンアップしていました。しかし、それがなくなった今、選択、コピー、貼り付け、泡立て、すすぎ、繰り返しを超えて、テキストの断片をすばやく取得するための良い方法が必要です。

理想的には、テキストを選択するとポップアップが表示され、それが何であるか (ユーザー定義のリスト、タイトル、開始時間、画像パスなどから) を尋ねられ、そのようにマークされます。当然、レコードの開始と終了をマークできる必要があります (すべての行データは連続しており、簡単に解析できる形式ではありません)。

おそらくこれを行うための何かを数時間で書くことができますが、何かが存在する場合、車輪を再発明したくありません. 私は OS X を使用していますが、どのプラットフォームのソフトウェアにも興味があります。

4

1 に答える 1

0

あなたのデータはHTML形式ですか?はいの場合は、Jsoup を使用できます

于 2013-07-10T13:03:36.557 に答える