問題タブ [folksonomy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tags - タグベースの Web サイトでセマンティックな問題に対処する方法
タグベースの Web サイトは、類義語や同音異義語などの言語のデリケートさに悩まされることがよくあります。情報を探しているプログラマーにとっては、スタック オーバーフローなどで、具体的な例を次に示します。
- Subversion または SVN (または svn、大文字と小文字を区別するタグ付き)
- .NET またはモノ
- 【追加します】
問題は、言語の繊細さを維持し、機械に可能な限り適切に対処させたいということです。
del.icio.us のようなサイトでは、タグ ベースが大幅に増加しているため、使用や検索が妨げられている可能性があります。SVN 関連のエントリを検索すると、subversion タグと svn タグの両方を持つエントリの大部分がリストされる可能性がありますが、次の 3 つの問題が考えられます。
- 多くのエントリには両方のタグ (「同義語」) がない可能性があるため、検索は不完全です。
- Q/A はより多くの Q につながることが多いため、検索はあまり役に立ちません。特に、特定のトピックの初心者向けです。
- 質問にタグを付ける (注: または個別の回答、便利に思えます) ことは哲学的になります: 「正しい方法でタグを付けましたか?」
これらの問題に対処する 1 つの方法は、タグ間にセマンティック リンクを作成することです。これにより、subversion と SVN は、貧弱なユーザーではなく、システムによって自動的にバインドされます。
良い/実現可能/魅力的/有用なアプローチですか? 効率よく実装するには?
regex - URLの最後のパスコンポーネントのrel-tagブックマークレット
多くのWebサイトはフォークソノミータグをサポートしています。「URLの最後のパスコンポーネントはタグのテキストです」と書かれているrel-tagについて聞いたことがあるかもしれません。
ブラウザで現在表示されているURLの「ラストパスコンポーネント」を取得し、そのタグを別のURLに追加して、新しいタブまたはウィンドウでそのページを開くためのブックマークレットまたはグリースモンキースクリプト(javascript)を探しています。
たとえば、「foo」というタグが付いたdelicious.comページを見ている場合、「foo」というタグが付いた新しいURLを作成したい場合があります。これは、 foo+barなどの最後のパスコンポーネントの複数のタグでも機能するはずです。
いくつかの正規表現の提案が提供されています。
php - PHP - 正規表現をチェックするフォークソノミー タグ
フリーフォームのフォークソノミーシステム用に送信されたタグの値をチェックするための正規表現を作成しようとしています。これが私が今持っているものです。
ハイフン、バックスラッシュ、スラッシュ、az、AZ、0-9、ピリオド、アンダースコア、アットマーク、一重引用符を許可し、その他はすべて禁止します。
否定された文字クラスがこれを進める方法だと確信しています...
ただし、上記のコードでは他の文字 (+ など) が許可されているようですが、その理由はわかりません。また、補足として、SQL インジェクションを誤って許可しないようにしているのかどうかはわかりません。任意のヒント?
search - フォークソノミーで検索してください。同義語の問題にどう取り組むか?
del.icio.us のような Web サイトで検索がどのように行われるかについて、誰かが光を当てることができますか?
おいしいのクエリとして「js」(1)、「javascript」(2)、または「java script」(3) を入力すると、Java Script に関するリソースが示されます。ただし、クエリによって返される結果セットは異なります (del.icio.us システムは、"js" クエリと "javascript" クエリに対して異なるブックマーク セットを返します)。
そのため、システムは (1) と (2) が互いに同義であることを実際には認識していないようです。代わりに、関連付けられたタグまたはタイトルのいずれかにクエリ文字列を含むブックマークに対してクエリを照合しようとします。あれは正しいですか?
(1)、(2)、(3) はすべて実際には同義語であり、選択したクエリに関係なく、ユーザーはすべての Java Script 関連リソースを表示する必要があることをシステムにどのように「教育」しますか?
それをするのは良い考えですか?
ありがとう、グレッグ
organization - 税金/フォークソノミーでタグを自動的に整理する
私は、コンテンツが豊富なサイトの1つ(場合によっては複数)で自然言語処理(NLP)を実行するプロセスに取り組んでいます。NLPが完了したら、出力(通常、そのメタファーの普及を考慮してタグと考えることができる一連の用語)を、ある種の標準または一般的に受け入れられている組織構造に自動的に編成します。
完璧な世界では、最終的な目標は「ドメインエキスパート」ではなく実際の人々をターゲットにしてアピールすることなので、これをフォークソノミーの概念(分類法ではなく)でクラウドソーシングしてほしいと思っていますが、私はオープンですアイデアとベストプラクティスに。スケーラビリティの明らかな目的のために、私はこの税/フォークソノミーの人口を自動化して、チーム/組織の「誰か」が(コンテキストの有無にかかわらず)大量の単語を任意に見る責任を負わないようにしたいと思いますツリーのコンテキストコンポーネントを肉付けします。
これを行うためのアイデアがいくつかあり、実行可能性を確立するためにいくつかの調査が必要ですが、この種のことについての実際的な経験はまったくないので、アイデアは実際には、タスクを達成する上で何らかの役割を果たす可能性のあるものに要約されます。他の人がこの種のことについてはるかに多くの経験を持っていることを想像して、私はあなたの肩に立つことができることを望んでいます。
あなたの考えと洞察に感謝します。
実例
私は自分のブログの記事に対してNLPを実行しました。NLPは、十分なレベルの関連性を持つ次の用語を返しました。
- ロブウィルカーソン
- 変化する
- ギット
今、私はそれらの用語を人間の介入なしに税/フォークソノミーに入れたいと思います。この場合、「Git」と「Rob Wilkerson」は分類できる用語です。これらの用語が追跡する価値のある十分な牽引力を生成しない場合、構造から用語を削除するプロセスに追加の規定があります。 。一方、「変更」はおそらく曖昧すぎて曖昧すぎて、問題を起こす価値はありません。
php - 複数のオブジェクト タイプ用に拡張された PHP タグ付けライブラリはありますか?
他のアプリケーションでfreetagを使用しました。(これらのアプリケーションでは満足しています。) しかし、私が見た他のタグ ライブラリと同様に、タグ付きオブジェクト テーブル内の単一のオブジェクト タイプを想定しています。
(これは、freetag からのテーブル定義ではありません。)
新しいプロジェクトで、複数のオブジェクト タイプ (ブログ投稿、フォーラム スレッドなど) のタグ付けを有効にしたいと考えています。そのためには、tagged_objects テーブルを拡張して、オブジェクト タイプを含める必要があります。
タグ付けされたオブジェクト テーブルを拡張してオブジェクト タイプを含める既存の PHP ライブラリはありますか?
ありがとう
mysql - Toxi mysql のパフォーマンス、タグ付け。理解を助ける
Web サイトのアイテムのタグ付けに Toxi スキームを使用しています。タグ付けは言うまでもなく、mysql にはまったく慣れていないので、サニティ チェックを行っているところです。これが私のテーブル初期化スクリプトです。
http://forge.mysql.com/wiki/TagSchema
質問1
「item_id」から「tag_id」までのすべての「Item2Tag」テーブルにエントリがあるという私の理解は正しいですか? 3000 個までのアイテムがあり、各アイテムに 5 個までのタグを付けることができる場合、それは巨大なテーブルになるようです。それは問題ではありませんか、実際には大きなテーブルではありませんか?
質問2
誰かが外部キー/参照を持つことの重要性を理解するのを手伝ってくれますか? それらが必要な理由と、それらは何をするのですか?
php - タグとして使用するために入力から人気のあるまたは関連する単語を取得する
SOでのタグ付けがどのように機能するかは誰もが知っています。投稿してタグを付けると、検索に役立ち、フォークソノミーで使用されます。
これが私がやりたいことです。人々に投稿にタグを付けるように強制する代わりに、私はどういうわけか投稿から関連する単語をフェッチしてタグとして使用することができます。
繰り返しの単語を取得するということとは別に、投稿から関連性のある単語を取得する方法はありますか?たぶん、インポートの単語を検出できる言語パーサーですか?
あなた自身の考えを教えてください。それは私が考えている線に沿っている必要はありません。ありがとう。
python - フォークソノミーを管理するためのライブラリ/プラットフォーム?
私は、重要なユーザーと衣服の自動タグ付けを含むアプリケーションを構築しています。
構造は一般的に次のようになります。
したがって、基本的に、単一のアイテムには、各「カテゴリ」からの1つ以上のタグが付けられます。タグのカテゴリは、相互排除などに関するルールを定義する場合があります。
私はすでに何かを用意していますが、このタグ付けメカニズムはプロジェクト内で有機的に進化したため、現在アプリで果たす中心的な役割に合わせて適切に設計されていませんでした。
これを再設計する前に、次のことを可能にするライブラリまたはプラットフォーム(できればPythonと簡単に相互運用できるもの)を誰かが知っているかどうか疑問に思っています。
- タグとカテゴリの作成/追加
- ルールセットの適用を可能にするためのカテゴリへのメタデータの追加(相互排除)
- 理想的には、クライアントが使用するためにデータセットをシリアル化するのは簡単です。
助言がありますか?
python - 段落から最も関連性の高い単語を選ぶ
この質問を適切に表現する方法がわかりませんが、これは、以下に概説する架空のシナリオを使用して達成しようとしていることです -
私へのユーザーの電子メールには、件名と本文だけがあり、件名は電子メールのトピックであり、本文はトピックの説明であり、最大 1000 語の 1 つの段落です。ここで、この段落 (BODY 内) をコンピューター言語 (python など) を使用して分析し、SUBJECT フィールドで言及されているトピックに関して段落から最も重要な単語のリストを作成したいと思います。
たとえば、メールのトピックが iPhone で、本文が「iPhone は超解像度とグラフィックスでユーザー インターフェイス デザインを再定義します。完全にタッチ可能で、ユーザーは画面をスワイプできます」のようなものだとします。
したがって、私が探している結果は、iPhone に関連する段落の重要な用語を含む一種のリストです。例 - (ユーザー インターフェイス、デザイン、解像度、グラフィックス、タッチ、スワイプ、画面)。
したがって、基本的には、段落から最も関連性の高い単語を選択することを検討しています。この結果を達成するために何を使用できるか、またはどのように使用できるかわかりません。グーグルで検索して、自然言語処理、Python、分類などについて少し読みました。これを行う方法についての一般的なアプローチが必要です-どのテクノロジー/言語を使用して、どの領域を読む必要があるかなど..
ありがとう!
編集:::
その間ずっと読んでました。正確には、WHAT TOOL を使用して、これを行う方法を検討しています。
同義語、形態学的類似性、スペルミス、文脈分析に基づく NLP を使用して、テキスト本文から関連タグを生成します。