問題タブ [information-extraction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image - デジタル画像からどのような情報が得られるのか
picasaで、カメラの詳細と画像が撮影された日付を確認できます。デジタル画像を使って他にどんな情報が見つかるのか知りたい。この目的に使用できるツールを知っていますか?
algorithm - 高速データ抽出アルゴリズム
2 つの utf-8 テキスト ファイルが必要です。ファイルの各行には文字列があり、Ü、Ö、ą、ę などの言語固有の文字を含めることができます。文字列はランダムな順序と長さで、繰り返すことができます。最初のファイルには、少なくとも 3 mln の行があります (1 mld の行を簡単に超える可能性があります)。2 番目のファイルは小さく、通常は約 40 万行になります (ただし、はるかに大きくなる可能性があります)。
ファイル 1 のエントリを含む新しいファイルを作成し、ファイル 2 に表示されるエントリを削除し、すべての繰り返しエントリを作成する必要があります。
現在、両方のファイルを並べ替えて、繰り返しエントリを削除しています。次に、2番目のファイルに表示されるかどうかを確認しながら、それらを新しいファイルに書き込みます。
これを行うより速い方法はありますか?
編集
メモリが問題です。この文字列をメモリにコピーせず、ファイルを操作します。私の友人は、メモリにコピーするのではなく、ファイル ストリームで作業することを提案しました。この後、実行時間は大幅に短縮されます。
コンピュータの管理者は、データベースをインストールしたくありません。
ループで次のようにコードルーンをソートした後:
c# - C#のファイルから拡張子を抽出しますか?
このアマチュアの投稿をお詫び申し上げます。
エラーがわかりません"Program.Program.GetExtension(string)': not all code paths return a value"
誰かが私が間違ったことを教えてもらえますか?
(ああ、fisierはファイルを意味し、caleはパスを意味し、extensieは私の言語の拡張子を意味します)。
前もって感謝します。
java - DBPediaExtractionフレームワークのインストール
http://wiki.dbpedia.org/Documentationに従ってDBPedia抽出フレームワークをインストールしようとしています。
Mavenバイナリバージョンをダウンロードしました。
抽出ディレクトリにいるときに、これを実行してインストールしようとしましたが、エラーが発生しました。
何が悪いのか知っていますか?ありがとう
javascript - JSON出力からプロパティを抽出し、ソケットに渡します
次のコードは、関数のプロパティを測定する監視モジュールを使用して、ノードサーバーで記述されています。私の問題は、JSON出力からプロパティの1つを抽出し、それをソケットに渡したいということです。
メーターは機能です:
毎秒JSON形式で印刷します。
出力:
たとえば、の値が必要mean
で、それを。に入れsocket.emit
ます。
ソケットのデバッグは"args":[0]
、平均値が0のようになります。
抽出する方法がわかりません。次のようになります。
yaml - QR コードを使用してテキストの書式を維持するにはどうすればよいですか?
QRコードを使ってyamlを送信したいです。スキャナがコードを読み取るときに、テキストの書式を維持する方法はありますか? QR コードのカスタム形式の実装についてどこで読むことができますか?
c++ - HWND からウィンドウ情報を取得する
私はこのコードを持っています:
SendMessage();
とを使用してウィンドウ タイトルを取得する方法は既に知っていますが、そのWM_GETTEXT
プロセス名と PID、および実行可能ファイルの場所と名前を取得する方法を知りたいです。
誰でも私を助けることができますか?
私は C++ MFC を使用していることに注意してください。
python - 正規表現: いくつかの可能なグループを検索する
正規表現の専門家が助けてください! 次の2つの例があります。
次の方法で、これら 2 つの文のさまざまな要素を抽出しようとしています (要素の種類が 3 つあることがわかっています)。
これを解決する方法を知っている人はいますか?
次の正規表現を試しました:
どちらの場合も、無効な正規表現のエラーが発生します。
理由はありますか?
information-extraction - 複数のWebサイトから抽出された情報の集約と重複排除
複数のWebサイトから抽出したレストランのタイミングと住所情報のデータベースの構築に取り組んでいます。同じレストランの情報が複数のWebサイトに存在する可能性があるため。したがって、データベースには、ほぼ重複するコピーがいくつかあります。
レストランの数が多いので、たとえば100000です。次に、新しいエントリごとに、100000 ^ 2の順序で比較して、ほぼ同じ名前のレストラン情報がすでに存在するかどうかを確認する必要があります。ですから、それよりも優れた効率的なアプローチがあるかどうかを尋ねています。ありがとうございました。