問題タブ [information-retrieval]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
494 参照

information-retrieval - データ分類プロジェクトに適したプログラミング言語とは

データ分類プロジェクトを簡単に実装したいので、そのためのライブラリを提供する言語を探しています。適切な言語を提案してもらえますか?

0 投票する
4 に答える
121 参照

sql - SQL Server データベースからファイルを取得するにはどうすればよいですか?

ファイルを SQL Server データベースに正常にアップロードしました。情報を GridView に戻すことができます。実際にファイルを開くためのハイパーリンクを作成する方法がわかりません。

0 投票する
4 に答える
1114 参照

algorithm - 潜在意味索引付け(LSI)は統計的分類アルゴリズムですか?

潜在意味索引付け(LSI)は統計的分類アルゴリズムですか?なぜまたはなぜそうではないのですか?

基本的に、統計分類のウィキペディアのページでLSIについて言及されていない理由を理解しようとしています。私はちょうどこのことに取り掛かっていて、何かを分類するためのすべての異なるアプローチが互いにどのように関連しているかを見ようとしています。

0 投票する
2 に答える
3342 参照

python - NLTKの他に、Pythonに最適な情報検索ライブラリは何ですか?

インターネット上のドキュメントの分析に使用します。

0 投票する
4 に答える
138 参照

information-retrieval - デザインについての質問

チームメイトと私は非常にやりがいのある新しいプロジェクトを抱えており、来週提出することになっています。どうやってそれを行うかについての手がかりは1つもありません。本当に助けが必要です. 私たちは学部生であり、情報検索と AI に慣れていないため、あなたのアイデアを本当に必要としています。

プロジェクトはおおよそ次のとおりです。

専門家が文書で引用されている場合、反対意見を持つ専門家を見つけて、そのトピックについて彼/彼女が何を言っているかを調べます。

プログラミング言語は自由に使用できますが、プログラミングには関心がありません。私たちは私たちを始めるための助けを求めています. そのようなシステムを設計する方法と、インターネット上で情報を取得する方法について、大まかなアイデアを教えてください。どうやって彼の意見を聞き、反対の意見を見つけたらよいでしょうか?

0 投票する
6 に答える
911 参照

architecture - ソフトウェア アーキテクチャへの正式なトップダウン アプローチについて学ぶには?

私は情報検索に興味のあるソフトウェア開発者です。現在、私は 3 番目の検索エンジン プロジェクトに取り組んでおり、同じバグなどで何度も何度も書かれているボイラープレート コードの量に非常に不満を感じています。

基本的な検索エンジンは、次の 2 つの「レイヤー」で構成される形式言語で記述できる非常に単純な獣です。

  1. 「プリミティブのレイヤー」(または公理、カーネル言語-名前の付け方がわからない)。それらは、いくつかのセット (リソースのセットとして - ファイル、Web サイト)、セット上の関係 (「サイト A がサイト B にリンクする」など)、および「リソース A へのストリームを開く」、「ストリームからレコードを読み取る」などの単純な操作で構成されます。 「N 個のストリームをマージ」、「フィールド F によるレコードのインデックス セット」など。また、「YAML 形式でストリームを保存」、「XML 形式からストリームをロード」など、多くのデータ変換があります。

  2. 「アプリケーション層」 - 「新しいリソースの収集」、「収集されたリソースのクロール」、「クロールされたリソースのデータベースへのマージ」、「クロールされたリソースのインデックス作成」、「インデックスのマージ」など、検索エンジンのライフサイクルを形成するいくつかの非常に高レベルの操作など。この高レベルの操作はすべて、1 から「プリミティブ」の用語で表現できます。

このような高レベルの表現は、選択したプログラミング言語で簡単にテストでき、おそらく正式に証明され、実装 (またはコード生成) できます。

では、質問: この方法でシステムを設計する人はいますか? 形式的に、厳密に (おそらく代数/群論のレベルでも)、厳密なトップダウン アプローチで? 何を読めば学べますか?

0 投票する
2 に答える
248 参照

artificial-intelligence - 情報のマイニング、分類、変更

次のシナリオの例、ヒント、ガイダンスはありますか?

いくつかの異なるニュースWebサイトから更新を取得しました。次に、その情報を分析して、世界の現在の傾向を予測します。

上記のアイデアを検索したときにデータマイニングに関する情報しか見つかりませんでしたが、それはデータベースシステム用です。データマイニングは私がやろうとしていることと似ていますが、データベース情報のデータマイニングは、私がWebサイトから取得したものよりも具体的です。それで、誰かがこの側面について私を導くことができますか?私はあなたがこれに関して与えることができるどんな助けにも本当に感謝します。

ありがとう。

0 投票する
7 に答える
2065 参照

python - 投票に基づくユーザー間の類似性

一連のユーザー、一連の曲、および各曲に対する一連の投票があるとしましょう:

歌の投票に基づいてユーザーの類似性を計算する最も効率的な方法は何ですか? すべてのユーザーとすべての曲のすべての投票を繰り返すよりも良い方法はありますか?

0 投票する
1 に答える
124 参照

information-retrieval - Googleページを取得する方法

親愛なる皆様、私は今webtoolを使用しています

http://fiddesktop.cs.northwestern.edu/mmp/scrape?url=

ウェブページを解析します。

たとえば、newyorktimes のホームページを解析するには、次のようにします。

http://fiddesktop.cs.northwestern.edu/mmp/scrape?url=http://www.nytimes.com/pages/world/index.html

ブラウザのアドレスバーで、物事をうまく解析してくれます。

ただし、Googleページでは失敗します。たとえば、次のように Google ニュースのヘッドページを解析したい場合:

http://fiddesktop.cs.northwestern.edu/mmp/scrape?url=http://news.google.com/nwshp?hl=en&tab=wn

常に 500 内部サーバー エラーが発生します。

私はそれがグーグルのウェブサイトと関係があると確信しています.おそらくグーグル用のAPIが必要だと思います.グーグルページのためにこれを整理する方法を知っている人はいますか? どうもありがとう。