問題タブ [extract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python: fasta 形式のシーケンスの先頭から文字を削除する
シーケンスの先頭に 17 bp のプライマーを含む fasta 形式のシーケンスがあります。また、プライマーにはミスマッチがある場合があります。したがって、fasta ヘッダーを除いて、シーケンスの最初の 17 文字を削除したいと考えています。
シーケンスは次のようになります。
Pythonでこれを行うにはどうすればよいですか?
ありがとう!ジョン
php - PHP Extract2 - 現在のシンボルテーブルに変数を割り当てる方法は?
関数があります。これは、extract() よりも安全に変数を抽出する方法です。
基本的に、配列から取り出す変数名を指定するだけです。
問題は、 extract() のように、これらの変数を「現在のシンボル テーブル」にどのように挿入するかということです。(つまり、関数内のローカル変数のスコープ)。
今のところ、グローバル変数にすることによってのみこれを行うことができます:
使用法:
物事がうまくいかない場所...関数内:
グローバルを回避し、代わりに var をローカル var スコープに挿入する方法はありますか?
pdf - PDFからすべてを抽出
PDF ファイルからコンテンツを抽出するソリューションを探しています (コンソール ツールまたはライブラリを使用)。
アップロードされた PDF ファイルからオンライン電子ブックを生成するためにサーバー上で使用されます。
次のものを抽出する必要があります。
- フォントとスタイルを含むテキスト;
- 画像;
- オーディオとビデオ;
- リンクとホットスポット。
- ページのスナップショットとサムネイル。
- 一般的な PDF 情報 (ブック レイアウト、ページ数など)。
Adobe PDF Library (ただし 5000 ドル)、BCL SDK (?)、PDFLib (795 ユーロ)、QuickPDF (250 ドル) を見てください。
現在、オープン ソースの pdf2xml (テキスト、画像、リンクを抽出) と GhostScript (スナップショットとサムネイル) を使用しています。他に残っているものは次のとおりです。
- フォント;
- マルチメディア;
- ホットスポット;
- ページ情報。
私たちは多額のお金を払うか (そして間違ったソリューションを選択して間違いを犯す可能性があります)、無料またはオープンソースのソリューションを使用するかをためらっています。
PDF からほぼすべてを抽出するための最適なソリューションはどれですか?
どんなコメントでも大歓迎です。
.net - .net で 7z ファイルを抽出する API
7z ファイルを読み取り/抽出できる .net で使用できる API はありますか?
python - zip ファイルをローカル ドライブにダウンロードし、Python 2.5 を使用してすべてのファイルを宛先フォルダーに抽出します。
zip ファイルをローカル ドライブにダウンロードし、すべてのファイルを宛先フォルダーに抽出しようとしています。
だから私は解決策を思いつきましたが、ディレクトリから別のディレクトリにファイルを「ダウンロード」するだけで、ファイルのダウンロードには機能しません。抽出の場合、2.6 では動作しますが、2.5 では動作しません。そのため、回避策や別のアプローチに関する提案があれば、私は間違いなく受け入れます。前もって感謝します。
3d - 3D サーフェス法線エクストラクタ
3D 65.000 の位置座標を持つ 3D の閉じたメッシュ オブジェクトがあります。ライティングの目的で、3D サーフェス法線抽出器が必要です。
手に入れるのを手伝ってくれませんか。
ありがとう。
リチャード
delphi - フォーマット(フォント名とサイズ)に基づいて単語またはPDFからテキストを抽出する
大きなテキスト (Word または PDF ドキュメントの約 1000 ページ) を解析し、このドキュメント内のテキストの一部をデータベース フィールドに配置する必要があります。
抽出したいテキストを区別できるのはフォーマットだけであることがわかりました。常に「Helvetica-Condensed」サイズ12です
それをしてもいいですか ?文字列関数の使用方法は知っていますが、フォーマットをテストするには何を使用すればよいですか?
私が言ったように、テキストはワード文書またはPDFの中に保存されています
サードパーティのコンポーネントがある場合は、問題なく実行できます。それを参照してください。
ありがとう
perl - Perl の HTML ページを指す JavaScript のリンクを抽出するにはどうすればよいですか?
ページからすべてのリンクを抽出したい。を使用してHTML:LinkExtor
います。HTML コンテンツ ページのみを指すすべてのリンクを抽出するにはどうすればよいですか?
これらの種類のリンクも抽出できません。
編集: HTML ページ - text/html。写真等のインデックスはしておりません。
rss - プログラムによる抽出のためのマッシュアップクエリを視覚的に設計する方法
私はインターネットページからさまざまな入力を取得するアプリケーションの開発に取り組んでいますが、各情報スニペットは異なる場所(マッシュアップ)から取得されます。ビジュアルツールを使用してマッシュアップビルディングブロック(スニペット)を生成したいと思います。そのようなプロジェクトに使用できる同様の何かを知っていますか?(すでに制御、サンプルコード、記事などが作成されています。)推奨される開発環境は.NETですが、必須ではありません。