問題タブ [tagging]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cakephp - Cakephp タグ付け - 新しいタグとタグ関係を自動保存
私は CakePHP でのタグ付けについてよく読みましたが、投稿とタグをこの投稿に保存する「クリーンな」方法を見つけることができません。Post テーブル、モデルとコントローラー、Tag テーブル、モデルとコントローラー、posts_tags テーブルに必要なものはすべて揃っています。ポストとタグ モデルで HABTM アソシエーションを作成しました。
新しい投稿を保存したい場合、CakePHP がその投稿に関連付けられたタグを自動的に保存するようにしたいのですが、そのための正しい方法が見つかりません。ほとんどのチュートリアルでは、「ヘルパー」関数 ( http://www.jamesfairhurst.co.uk/posts/view/full_cakephp_application_part_5 => "_parse_genres") またはそのようなものを使用する必要がありますが、CakePHP との取引を考えましたつまり、正しくセットアップすれば、これはすべて Cake によって行われます。
私の質問は、それを行うための「クリーンな」ケーキの方法はありますか、それともヘルパー関数を使用する必要がありますか?
search - StackOverflow はタグ付き検索に Lucene を使用しますか?
SO はタグ付き検索をどのように実装しましたか? タグ付き検索に Lucene またはその他のオープンソース検索エンジン ライブラリを使用していますか?
ドキュメント (PDF、XML、HTML、MS Word) またはデータベースを検索する最良の方法は何ですか?
tags - コンテンツの自動分類
私がメンバーである特定の meetup.com グループのメッセージ アーカイブからメッセージを抽出するスクリプトを開発しています - http://www.meetup.com/opencoffee/messages/archive/
アイデアは、これらをワードプレス サイトに動的に追加し、人々がメッセージを検索したり、メッセージに自動タグ付けしたりできるようにすることです。
私が抱えている問題は、これらのメッセージを自動的に分類する方法です。これを行う最善の方法と、これをプログラミングする最も効率的な方法についての考えやアイデアを歓迎します。
オプション1
デリシャス API を使用して、金融、テクノロジー、ビジネスなどのサブジェクト エリアごとにタグのソースを検索し、サブジェクトごとに関連するタグを見つけます。
http://delicious.com/tag/finance
http://delicious.com/tag/technology
メッセージにこれらのタグが含まれている場合、メッセージはそれぞれのカテゴリに割り当てられます。
これでうまくいくと思いますが、これらのタグのメッセージをスキャンする最も効率的な方法はわかりません。
オプション 2
ft.com、金融のエコノミスト、テクノロジーのテッククランチなど、必要なカテゴリを代表するサイトを見つけて、これらのサイトにタグを付けるために人々がどのタグを使用しているかを判断し、デフォルトでそれらのタグがどのように機能するかを判断しますこれらのサイトとそのコンテンツ スタックに関連しています。
オプション 3
メッセージの URL をhttp://semanticproxy.com/ (Reuters Calais プロジェクトの一部) に渡すか、Open Calais API を使用します。これは私が試しましたが、意味のある分類法を返すにはコンテンツの深さが可変であるとは限らないため、あまり成功しませんでした。
calais api を介して解析したメッセージの例を次に示します。
オリジナルメッセージ
http://www.meetup.com/opencoffee/messages/6045615/
カレーの結果
http://www.mashinteractive.com/opencoffee/calais.php
まとめ
それで、それはそれについてです。方法論に関する考えやアイデア、およびオプション 1 と 2 のメッセージ スキャンへの最善のアプローチ方法に関するヒントを歓迎します。
参考までに、これまでに約 1,700 件のメッセージがあり、10 個のカテゴリがあり、各カテゴリが 20 個または 30 個のタグで定義されていると推測しています。
これを行うための Wordpress プラグインまたはクラスの開発を支援したい人がいる場合は、喜んで参加させていただきます。私はプログラマーではないことを心に留めておいてください。私はプログラマーではないことに注意してください。
前もって感謝します
ジョナサンCEO
群衆の人々
linq-to-sql - Linqtosql-クエリ内のすべてのタグに一致するすべてのエンティティを検索します
私は古典的な3つのテーブル-entity、tag、entitytag-データベース構造を持っています。
特定のタグでタグ付けされたすべてのエンティティを検索するために、次のLinqtosqlコードを使用しています。
ただし、エンティティに重複するタグがある場合(実際のアプリではこれには正当な理由があります)、クエリはすべてのタグに一致しないエンティティを返します。
たとえば、上記のコードサンプルでは、エンティティが「tag2」ではなく「tag1」で2回タグ付けされている場合、両方のタグが一致していなくても結果に返されます。
これらのエンティティを結果から除外する方法がわかりませんか?
それとも、私が取るべき完全に異なるアプローチがありますか?
php - 最適な DB (MySQL) 構造: お気に入りのタグを含む記事
ニュース サイトを作成しました: - 記事は日付順にフロント ページに表示されます。まずは最新のもの。- ニュースは、フィールド「id」、「タイトル」、「テキスト」およびその他のフィールドを持つテーブル「ニュース」にあります。- すべての記事には、1 ~ 5 個の関連するタグが付けられています。- タグは、フィールド「id」、「tag」、「article」およびその他のフィールドを持つテーブル「tags」にあります。・「tags」の「article」フィールドは「news」の「id」フィールドに収まります。
ここで、ユーザーに「お気に入りのタグ リスト」にタグを追加する機会を与えたいと考えています。その場合、ユーザーはお気に入りのタグの 1 つを含むニュース記事のみを表示する必要があります。
ユーザー Bob が "barack obama"、"nba"、"new jersey"、"dogs" というタグを気に入ったとします。これら 4 つのタグの少なくとも 1 つを含む記事のみが表示されるはずです。
これを実現する PHP/MySQL スクリプトをどのようにコーディングできますか? 私のデータベース構造は、この目的には十分ではないと思いますか? 次のような DB クエリを作成する必要があります。
"SELECT * FROM news WHERE id IN (SELECT article FROM tags WHERE tag IN ('barack obama', 'nba', 'new jersey', 'dogs'))"
このクエリは長時間実行されますね。私のよりも適切なデータベース構造が必要です。この問題のアイデアはありますか? どの DB 構造が必要で、どのクエリを使用する必要がありますか?
あなたが私を助けてくれることを願っています。前もって感謝します!
nhibernate - Nhibernateタグクラウド
タグクラウドアーキテクチャをNHibernateで機能させようとしています。
このテーブルはスキーマ内のいくつかのエンティティにマップされるため、各関連付けのTagクラスにコレクションを追加したくありません。
ただし、タグエンティティをクエリして、結合されたすべてのテーブルにわたってcount(*)を返したいと思います。SQLでこれを簡単に行うことができましたが、NHではまだ光が見えていません。
いくつかのHQLを書き始めました。
何に参加しますか?オブジェクトモデルでは、多対多のブリッジテーブルにはクラスもプロパティもないので、これは機能しないことを意味しますか?
あなたは何を提案しますか?これがCriteriaで実行できるかどうかを確認することに興味があります。
どうもありがとう、
イアン
database - エンティティに関連付けられた説明タグは、別のデータベース テーブルに格納する必要がありますか?
私には質問モデルがあり、StackOverflow と同じように、ユーザーは各質問に複数の説明タグを付けることができます。
私が判断しようとしているのは、質問に関連付けられたタグをデータベースの別のテーブルに保存する必要があるかどうかです。
または、スペースで区切られた文字列のリストとして、質問テーブルの単一のフィールドとしてタグを保存できますか?
どちらがより理にかなっているのかわかりません。データを分離する正当な理由はありますか?
php - LSA - 潜在的セマンティック分析 - PHP でコーディングするには?
テキストのトピック/タグを見つけるために、潜在的意味分析 (LSA) を PHP に実装したいと考えています。
これが私がしなければならないと思うことです。これは正しいです?PHPでコーディングするにはどうすればよいですか?どの単語を選択するかを決定するにはどうすればよいですか?
外部ライブラリを使用したくありません。私はすでに Singular Value Decomposition (SVD) の実装をしています。
- 指定されたテキストからすべての単語を抽出します。
- tf–idfなどを使用して、単語/フレーズに重みを付けます。重み付けが複雑すぎる場合は、発生回数だけを取ります。
- マトリックスを作成します。列はデータベースからのいくつかのドキュメント (多いほど良いですか?)、行はすべて固有の単語、値は出現回数または重みです。
- 特異値分解 (SVD) を実行します。
- 行列 S (SVD) の値を使用して、次元削減を行います (どのように?)。
あなたが私を助けてくれることを願っています。事前にどうもありがとうございました!
ruby-on-rails - flickrのタグクラスタリングシステムを実装する方法について何かアイデアはありますか?(できればRailsで)
私は主に、分散型、非正規化、完全にオープンなユーザー送信タグから、それらを「クラスター」と呼ばれるセマンティックグループに結合することですべてを理解し始める方法についてのアプローチの議論を探しています。
使用されているタグが実際に何を意味しているのかを実際に理解するのに実際の人が必要ですか、それともタグが一緒になる頻度を自動的に分析するだけでそれを行うことができますか?
そのようなもの。自由に乱暴に詳しく説明してください:)(また、これが他の場所で議論されている場合は、それについて聞いてみたいです)。