問題タブ [summarization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vba - Excel テーブルの一部を要約する
Microsoft Excel Office の VBA について質問があります。
2 行 (頭から下) と数千行のテーブルがあります。
最初の行には、Adobe などのソフトウェア会社の名前を含む文字列があります。
2 行目には、Acrobat Reader 11 のような 1 行目の会社の製品名を含む文字列があります。
だから私が欲しいのは、「Acrobat Reader 11」と「Acrobat Reader 10」のような行2の文字列が「Acrobat Reader」に要約されることです。これは可能ですか? バージョン番号だけでなく、「Office Word」「Office Excel」から「Office」まで。
手伝って頂けますか?ちなみに私はVBAとExcel初心者です。
あいさつ
r - 各グループの最も頻度の高い文字列値を返します
a
変数でグループ化し、最も頻度の高い値を返したいb
私の望ましい結果は次のようになります
そのdplyr
中には次のようなものがあります
dplyr
問題を視覚化するためだけに言及しました。
r - 各研究アームを示すバイナリ インジケーター変数を使用して 2 つのグループを比較し、分析用にインジケーターを使用してグループのみを選択する
私はデータセットを持っています:
各アームで分析を実行したい。グループ = 1 およびグループ = 2。したがって、group=1 のみ、次に group=2 のみのすべてのカウント変数を分析する必要があります。
mysql - MySQL はすべてのアイテムをカウントし、他のアイテムよりも少なく集計します
円グラフを作成するには、多くの mysql 5.6 テーブルからデータをフェッチする必要があります。ご存知のように、円グラフは意味のあるデータを表す場合に役立ちます。ただし、意味のないデータ ポイントが多数ある場合、たとえば .. 未満または重要でない値の場合、円グラフは不明確になります。各カテゴリの発生をカウントし、重要でないカウント (X 未満) を OTHERS として集計する必要があります。
現時点で私は
それは私に各カテゴリを与え、それは重要です。合計が50を超えるカテゴリとそれ以下のカテゴリを「その他」にまとめて取得するにはどうすればよいですか。ありがとう、ホルヘ。
r - R - nlevels() を使用した ddply の要約が機能しない
plyr パッケージを使用してデータを要約する場合、nlevels() 関数を使用できないようです。
私のデータセットの構造は次のとおりです。
知りたいのは、変数「SOC」を使ってデータセットを分割する際に、作成されたデータセクションの「ID」変数にいくつのレベルが存在するかです。 この情報を他の変数と一緒に新しいデータ セットにまとめたいと思います。したがって、次のように plyr パッケージを使用したいと思います。
これにより、次のエラーが返されます。
誰かが私の目標を達成する方法についてアドバイスをくれますか? または、私が間違っていることは何ですか?
よろしくお願いします!
perl - MEAD (Perl パッケージ) のインストール
テキスト要約用にMEAD http://www.summarization.com/mead/をインストールしようとしていますが、bin フォルダーから基本的な例を実行しようとすると、
以下のエラーが表示されます。
奇妙なことに、私はすでに expat をインストールしています。このエラーの原因は何でしょうか?
machine-learning - 概念ベースのテキスト要約 (抽象化)
文章の概念や意味に基づいて AI でテキストを要約するエンジンを探しています。(ginger、paraphrase、ace) などのオープンソース プロジェクトを調べましたが、うまくいきません。彼らが働く方法は、各単語の同義語を見つけて現在の単語に置き換えようとすることです。このようにして、文の代替をたくさん生成しますが、ほとんどの場合、意味は間違っています.
私はスタンフォード大学のエンジンを使って、記事のハイライトのようなことを行い、それに基づいて最も重要な文を抽出しましたが、それでもこれは抽象化ではなく、その抽出です。
私が探しているエンジンが時間の経過とともに学習し、各要約の後に結果が改善されることも理にかなっています。
ここで助けてください、あなたの助けは大歓迎です!
r - Rの複数の列のグループ内の変化率を計算するにはどうすればよいですか?
ID 列、日付列 (ID ごとに 12 か月) を持つデータ フレームがあり、23 個の数値変数があります。各ID内の月ごとの変化率を取得したいと考えています。変化率を取得するために quantmod パッケージを使用しています。
以下は、3 つの列のみの例です (簡単にするため)。
dplyr と summarise_each 関数を使用しようとしましたが、うまくいきませんでした。より具体的には、次のことを試しました(trainはデータセットの名前です):
また、dplyr で do 関数を使用しようとしましたが、どちらも成功しませんでした (ひどい夜だったと思います!)。
問題は Delt 関数だと思います。Delt を sum 関数に置き換えると、次のようになります。
その結果、すべての変数が各 ID の日付にわたって合計されます。では、各 ID のパーセンテージは月ごとにどのように変化するのでしょうか?
machine-learning - 自動テキスト / HTML 注釈 / ハイライト
最近では、テキストまたは HTML 文書ページを提供すると要約を出力するソフトウェアがあります。
同じドキュメントに自動的に注釈を付ける (または少なくとも強調表示する) ものがあるのではないかと思います。
アイデアは、全文を保持できるようにすることですが、最も意味のある部分を強調することです (要約ツールのようなものだと思います)。そして、おそらく追加の推測された洞察を提供します (?)
また、それが存在する場合、それがどのように機能するかを知りたいです:)それは本当に要約とは非常に異なるのでしょうか、それとも「出力形式」が異なるだけで同じ原則ですか?
AnnotatorJS が設計されているように、次のように HTML ドキュメントに注釈を付けるものを探しています。