問題タブ [trending]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 特定のツイートのコレクションでトレンド トピックを定義する
Twitter 検索で取得した特定のツイートのコレクションからトレンド トピックを特定する必要がある Java アプリケーションを実行しています。Web で検索しているときに、特定の時間、つまり正確な瞬間に多数の言及がある場合に、トピックがトレンドであるとアルゴリズムが定義していることがわかりました。したがって、トピックが頻繁に変わるように減衰計算が必要です。ただし、別の疑問があります。
Twitter は、ツイート内の特定の用語が TT であるべきかどうかをどのように判断しますか? たとえば、ほとんどの TT はハッシュタグまたは固有名詞であることがわかりました。これは意味がありますか?それとも、すべての単語を分析して頻度を決定しますか?
誰かが私を助けてくれることを願っています!ありがとう!
php - 傾向データを保存する最良の方法は何ですか?
現在、(現在) 約 15,000 製品の統計データをインポートするアプリケーションを構築しています。現在、1 つのソースからの毎日の統計に対して 1 つのデータベース テーブルを維持する場合、1 日あたり 15,000 行のデータ (行ごとに 5 ~ 10 フィールドとしましょう。主に float、int) が増加します。明らかに、1 つのテーブルに年間 500 万件を超えるレコードが含まれています。
それは、他のソースからデータを取り込むという考えほど私には関係ありません (したがって、新しいソースごとにデータベースのサイズを 500 万レコードずつ増やします)。
現在、データは統計/傾向ベースのデータであり、基本的に 1 レコードにつき 1 日 1 回の書き込みと、多くの読み取りが行われます。ただし、オンザフライのレポートとグラフ作成のために、ルール (日付範囲、値範囲など) に基づいてデータのサブセットにすばやくアクセスする必要があります。
私の質問は、これがデータ (MySQL InnoDb テーブル) を保存する最良の方法ですか、それとも統計/傾向データを保存および処理するためのより良い方法ですか?
この時点で検討したその他のオプション: 1. 複数のデータベース (製品ごとに 1 つ)。データ ソースごとに個別のテーブルがあります。(つまり、データベース: ProductA、テーブル:Source_A、Source_B、Source_C) 2. 1 つのデータベース、複数のテーブル (製品/データ ソースごとに 1 つ) (つまり、データベース: Products、テーブル: ProductA_SourceA、ProductA_SourceB など。 ) 3.factual
データベース内のすべてまたは特定の製品情報と、statistical
別のディレクトリ内の csv、xml、json (フラット ファイル) 内のすべてのデータ。
これまでのところ、これらのオプションはどれも管理しやすく、それぞれに長所と短所があります。開発のアルファ段階に入る前に、妥当な解決策が必要です。
php - トレンド検索ヘルプ
私のサイトは、人々がメインページに検索クエリを入力する検索エンジンのように機能します。各クエリがmysqlデータベースに記録され、そのデータからどの検索が最も検索されているかを計算し、トレンド検索としてラベル付けされたページに表示されるトレンド/最近の機能を作成したいと思いました。また、その下に、最近の5件程度の検索を表示する「最近の検索」をお願いします。
正直なところ、私はmysqlの経験がありません。自分のサイトからmysqlにデータを移動する方法すら知りません。どんな助けでもいただければ幸いです。これらの質問とグーグルを検索して検索しましたが、何も見つかりませんでした。ありがとう!
python - Pythonで数値トレンドラインを計算する方法
キュー (queue_len) 内のエントリ数を計算する Python 2.6 の監視アプリケーションがあります。これらの queue_len の経時変化率の値を使用して、そこからトレンドを抽出できる単純な関数を作成したいと考えています。
目標は、フリップフロップではなく、時間の経過に伴う +ive または -ive の傾向に応じて、キュー処理ノードを起動またはシャットダウンすることです。
金融分野のMACDは、私が必要としているもののように見えますか? ここで助けを探しています。
mysql - MySQL での経時的な増加傾向または減少傾向の計算
store_visits
次の構造のテーブルがあります。
私の目標は、各店舗と特定の日付範囲について、以下を計算するクエリを作成することです。
- 期間中の平均訪問数 (現在 を使用
AVG(visit_count)
) - 来店数が増加しているか減少しているか
- 増減の相対率 (1 から 4 のスケールで、1 = 低率、4 = 高率)
訪問数の相対的な増加/減少率は、方向性のみを目的としています。常に線形スケールになります。
これを行うための MySQL クエリを作成するのに 1 日を費やしましたが、理解できません。
どんな助けでも大歓迎です。
ありがとう -スコット
php - 人気のある記事 アルゴリズムと崩壊
サイトで人気のあるものを人々が見ることができるようにする、記事とビデオ (投稿) を備えた既存のサイトのトップの機能を構築します。各投稿に次のフィールドがあります。
- 投稿が公開されてからの秒数
- 投稿に対するコメント数
- 投稿の「いいね」の数
何が人気があるかを判断するための単純なアルゴリズムを焼きたいのですが、(時間の経過から)減衰を考慮する必要があります。
twitter - 複数単語のTwitterトレンドトピック
Twitter.comが複数の単語でトレンドトピックを分類するために使用するアルゴリズムを教えてもらえますか?「#SoulTrainAwards」や「#DontYouWish」など、一言だけのトレンドを扱う場合、問題は簡単です。ただし、「Chrisette Michelle」、「Happy Halloween」、「Merry Christmas」など、複数の単語を含むトレンドを扱う場合は、まったく別の問題になります。これは、mltiple-wordトレンドの単語が別のトレンドになる可能性があるためです。たとえば、「Happy」という単語、または「Christmas」という単語だけを言います。
ruby-on-rails - MongoDB Trending Topics Gem はありますか?
ツイートのサイズに関する「説明」値を持つドキュメントのグループが MongoDB にあります。これからトレンド トピック リストを生成する必要があります。明らかにこれは解決された問題ですが、自分でコードを書かずに仕事を終わらせるための決定的な答え/宝石を見つけることはできません.
アプリでルビーとモンゴイドを使用しています。
これを支援または処理するルビーの宝石はありますか? ありがとう。
php - キーを使用して配列値を新しい変数に保存する - twitter api
Twitter で現在トレンドになっているハッシュタグを含む過去 100 件のツイートを返すコードを作成しようとしています。まず、現在のトレンドのコンテンツを取得し、トレンドのハッシュタグだけを分離します。
しかし、トレンド ['name'] をエコーするのではなく、Twitter の検索方法を使用して検索するために使用したいと考えています。if ステートメント内に次のようなものを追加します。
しかし、変数 $hashtag が正しく定義されておらず、その理由がわかりません。($hashtags をエコーして、適切な値が保存されていることを確認しようとすると、何も出力されません。) では、$trend['name'] の値を URL で使用できるようにするには、何を変更すればよいでしょうか。話題のハッシュタグを含む過去のツイートを取得するための検索方法は?
ありがとうございました!
python - Djangoでトレンドアルゴリズムを決定して実装する
単純なトレンド/ランキングアルゴリズムを実装する必要があるDjangoアプリケーションがあります。私は:として非常に失われています
私は2つのモデルを持っています、Book
そしてReader
。毎晩、新しい本が私のデータベースに追加されます。各本の読者数も毎晩更新されます。つまり、1冊の本には複数の読者統計レコードがあります(1日につき1レコード)。
特定の期間(過去1週間、過去1か月、または過去1年間)で、最も人気のある本をリストしたいのですが、これにはどのアルゴリズムを使用すればよいですか?
各本の読者数は毎日更新されるだけなので、人気はリアルタイムである必要はありません。
トレンドのウィキペディアの記事をどのように計算したかを示す別のSO投稿で参照されている記事を見つけましたが、その投稿は現在のトレンドの計算方法のみを示していました。
SOについて誰かが指摘したように、これは非常に単純なベースライントレンドアルゴリズムであり、2つのデータポイント間の勾配のみを計算するため、昨日と今日の間のトレンドを示していると思います。
Hacker News、Redditなどで使用されているような非常に複雑なトレンドアルゴリズムを探していません。
リーダー数と日付の2つのデータ軸しかありません。
何をどのように実装すべきかについてのアイデア。統計/アルゴリズムに関連するものを一度も扱ったことがない人にとって、これは非常に困難な作業のようです。
みなさん、よろしくお願いします。