9

これは文字を認識しないため、実際には「OCR」ではありませんが、曲線に適用されるのと同じ考え方です。(ラスター)プロット画像から値を取得するための画像処理ライブラリまたは確立されたアルゴリズムを知っている人はいますか?たとえば、このグラフでは、グリッド線の間に次のようなギャップがあるため、目で正確な値を読み取るのは困難です。

代替テキスト

直定規などを使用できますが、それでもエラーが発生しやすくなります。古いグラフのスクリーンショットを撮って、それを値の表または照会できる関数に自動的に変換できるソフトウェアがあれば素晴らしいと思います。

「曲線認識」と呼ばれているようですか?基礎となるデータが公開されていない科学論文の曲線からデータを抽出するためにも使用できます。

そして、人間の指導があっても大丈夫です。たとえば、OCRが「100」を読み取って線と一致させることができなかった理由はありませんが、マシンがグリッド線を基準にした曲線のパスを抽出した後、人間が線に数値を与えることは問題ありません。グリッドが非アフィンな方法で傾斜、回転、またはワープされている場合でも、グリッドを基準にして曲線をトレースする機能に主に関心があります。

アップデート:

リンクに多数のソフトウェアを使用してスキャンしたグラフをデータに変換するというウィキペディアの記事があります。また、alternativeto.net上のいくつかのソフトウェア。ソフトウェアソリューションがhttp://superuser.comに属しているのに対し、理論は現在http://dsp.stackexchange.comに属していると思いますか?

4

7 に答える 7

6

これは非常に難しく、エラーが発生しやすくなります。(化学を分析しようとする化学では、この種のことをよく行います。)それは、さまざまなパラメーターや条件に大きく依存します。

  1. 画像はビットマップ (ピクセルのみ) ですか、それともベクター (EMF、WMF、SVG、PS、PDF...) ですか? ベクトルはピクセルよりもはるかに優れています。ベクトル (PDF を含む) に取り組みますが、ピクセルには触れません。一部の共同編集者はピクセルを使用しようとしますが、かなり最近のドキュメントに対してのみです。
  2. ピクセルにこだわっている場合、画像はすべて同じソースからのものですか? その場合、フォント情報を抽出できる可能性はわずかです。残念ながら、あなたのイメージは非常に貧弱であり、多くの作業が必要になるでしょう. ただし、すべてのドキュメントが同じソースからのものであれば、フォントを解決できれば、テキストと数字を抽出できる可能性があります。ヒューリスティック (数値がどこにあるかなどのルール) または機械学習 (メソッドをトレーニングできる機能のリスト) を使用できます。
  3. 画像がスキャンされたように見えます (軸がピクセル化されているため)。それはそれをさらに悪化させます。目には直線に見えるものは、機械にとっては恐ろしいものです。ページ上で画像が歪んでいませんか? デスキューしなければならない場合があります。
  4. 線と曲線のモデルがある場合は、モデル化に必要なパラメーターが画像に変更される可能性があります。しかし、それは些細なことではありません。

悲観的で申し訳ありません。本当に情報が必要な場合は、多額の投資を行うか、この種のことを行うグループと協力して行うことができます。

于 2009-11-01T19:35:28.230 に答える
3

http://www.digitizeit.de/は、グラフをデジタル化するためのプログラムです。

于 2010-12-26T19:31:29.677 に答える
3

「曲線認識ソフトウェア」のグーグルは、http://www.curveunscan.com/を示唆しています

于 2009-11-01T22:54:33.840 に答える
2

関連するpotraceもあり、そのページには他の代替案が記載されています

于 2010-08-15T00:31:29.713 に答える
1

あなたが求めていることを実行するソフトウェアは知りませんが、いくつかのポイントを取得できる場合は、ある種の回帰を使用して、それらのポイントに適合する最適な関数を見つけることができます。この特定のグラフは指数関数のように見えます。したがって、指数回帰計算機を見つけたいと思うでしょう。

于 2009-11-01T19:45:13.610 に答える
1

im2graph を使用して、グラフ イメージをデータ、つまり数値に変換します。im2graph は無料で、Linux と Windows で利用できます。非常にスムーズで、結果を生成するために必要な労力はほとんどありません。http://www.im2graph.co.ilを参照

于 2015-04-24T04:38:02.637 に答える