問題タブ [summarization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
12765 参照

r - 要約統計量のプロット

次のデータセットの場合、

Genrex軸がすべての金額の合計であり、y軸がすべての金額の合計であるggplot2折れ線グラフを作成したいと思います(条件付きGenre)。

私は次のことを試しました:

しかし、役に立たない。

0 投票する
1 に答える
717 参照

mahout - 私には何が適切ですか?generateAllGrams() または generateCollocations() で十分ですか?

コロケーションを抽出する必要があるワードネットベースのドキュメントサマライザーでプロジェクトを開発しています。できる限り調査を試みましたが、Mahout を使用したことがないため、CollocDriver.java が (API コンテキストで) どのように機能するかを理解するのに苦労しています。

ウェブを精査しているときに、これにたどり着きました: Mahout Collocations

これが問題です: POSTagged の入力テキストがあります。私はそれでコロケーションを識別する必要があります.私はcollocdriver.Javaコードを持っています..今、私はそれをどのように使用するかを知る必要がありますか? サマライザー内のサブタスクには、generateAllGrams() メソッドを使用するか、generateCollocations() メソッドのみを使用するかで十分です..??

そして最も重要なことは、それをどのように使用するのですか?私は認めますが、この質問を提起します.APIについてよく知りません.

collocdriver のgrepcode バージョンも取得しました。2つの実装は少し異なるようです。入力は、grepcode バージョンの文字列であり、元の Path オブジェクトの形式です...

私の質問:入力パラメーターの構成オブジェクトとは何ですか?また、その使用方法は?? ソース/宛先は文字列(grepcodeのように)またはパス(オリジナルのように)になりますか?? 出力はどうなりますか?

私は collocdriver プログラムでさらに研究開発を行いました...私はそれがシーケンスファイルを使用し、次にベクトル生成を使用することを発見しました...私はこのシーケンスファイル/ベクトル生成がどのように機能するか知りたいです..plz help..

0 投票する
1 に答える
366 参照

ruby - 問題の構築要約宝石

RubyでSummarizegemを使用しようとしていますが、gem install summaryを実行すると、次のようになります。

何か案は??

0 投票する
2 に答える
2492 参照

python - ウィキペディアの記事の要約

私は常に新しいことを学ばなければならないことに気づきました。新しい科目を学ぶプロセスを早める方法を考えてみました。ウィキペディアの記事を解析し、最も重要な情報以外をすべて削除するプログラムを作成できれば、すばらしいと思いました。

PDFに関するウィキペディアの記事から、最初の 100 文を抽出することから始めました。私は、それがどれほど価値があると思ったかに基づいて、各文にスコアを付けました. 最終的に、次の形式のファイルを作成しました。

次に、このファイルを解析し、各文を指定した値と関連付けるさまざまな関数を見つけようとしました。機械学習や統計学などを学び始めたばかりなので、いろいろ手探りでやっています。これは私の最新の試みです: https://github.com/JesseAldridge/Wikipedia-Summarizer/blob/master/plot_sentences.py

まったく相関関係がないように思われるものをたくさん試してみました -- 単語の長さの平均、記事内の位置など(より具体的には、小文字の 'e' の数を数えるのが最もうまくいくようです)。しかし、それは少し不自由に思えます。なぜなら、より長い文には有用な情報が含まれる可能性が高いことは明らかだからです。

ある時点で、いくつかの興味深い関数を見つけたと思ったのですが、(内側の四分位数だけを数えて) 外れ値を削除しようとすると、すべての文に対して単純に 0 を返し、悪い結果になることが判明しました。これは、私が間違っている可能性のある他の多くのことについて疑問に思いました...また、これがこの問題に取り組む良い方法であるかどうかも疑問に思っています.

私は正しい軌道に乗っていると思いますか?それとも、これは単なるばかげた用事ですか?リンクされたコードに明らかな欠陥はありますか? ウィキペディアの記事を要約する問題にアプローチするより良い方法を知っている人はいますか? まとめるのに長い時間がかかる完璧なものよりも、迅速で汚い解決策が欲しい. 一般的なアドバイスも歓迎します。

0 投票する
2 に答える
4722 参照

python - Textrank: networkx を使用した文抽出のためのページランクの補完

here で説明されているように、文抽出用の textrank アルゴリズムを実装しようとしています。そのためには、加重エッジで pagerank アルゴリズムを補完し、無向グラフで実行できるようにする必要があります。Networkx pagerank アルゴリズムの実装により、加重エッジを簡単に統合でき、有向グラフを無向グラフに変換すると言われています。こちらを参照してください。ただし、テストしたところ、有向グラフを使用しているようです。ここで何が欠けていますか?大いに感謝します。

例:


出力: {'A': 0.25974025929223499、'C': 0.40692640737443164、'B': 0.3333333333333331}

0 投票する
5 に答える
2163 参照

javascript - jQueryThreeDotsプラグインですが拡張可能

私のテキストを要約するjQueryプラグインはありますか?

の中へ

ただし、その3つのドットをクリックすると、展開されて次のように表示されます。

プラグインなしでcssとjqueryは大歓迎です。

何か案は?

0 投票する
2 に答える
1528 参照

php - Phpで重複する配列行を追加する

PHP で、配列の行と共有列の値を加算する関数を作成したいと考えています。

というわけでインプット。

そしてアウトプット。

考えている

ここで、$col は重複していない配列です。だから、私の場合、

希望の出力が得られます。これについて助けてくれてありがとう。

0 投票する
3 に答える
2840 参照

r - Rのループの結果を合計しますか?

私はこの小さなコードを作成しましたが、ループの結果を要約するのに問題があります。誰かが私を助けることができますか?

結果として8つの数字が表示されますが、最後の数字しか表示できません

0 投票する
2 に答える
1792 参照

python - 自動テキスト要約

Python/Django を使用して自動テキスト要約ツールを開発することにしました。

誰かが始める方法についての本や記事を推薦してもらえますか?

アイデアを得ることができるように、自動テキスト要約にオープンソースのアルゴリズムまたは作成されたプロジェクトはありますか?

また、Django/Python での新しいやりがいのある FYP を提案していただけませんか?