問題タブ [openrefine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
openrefine - OpenRefine の調整サービスが機能していませんか?
OpenRefine で調整の問題を経験した人はいますか? アメリカの大学のリストをインポートし、50 行を選択して、Freebase、DBpedia、OpenCorporates 調整サービスを試しました。私は以前、DBpedia で複数の成功を収めました (大学向け) が、現在、どれも機能していません。(リストされているすべてのサービスも調べました。)先頭と末尾のスペースをトリミングし、重複をチェックしました。問題なく動作していたのはわずか 2 か月ほど前で、その間 OpenRefine を更新していません。[更新]: 1 つの調整サービスを機能させることができましたが、必要なオントロジーでは機能しませんでした。つまり、重要な情報を忘れているか、大学名を照合するサービスが機能しなくなっているかのどちらかです。
regex - Googleリファインで単一のセルを括弧内の複数の数字からコンマに置き換える方法
どうすれば変更できますか
の中へ
Google Refine での GREL と Regex の使用。
etl - Openrefine がテンプレートと連携して JSON をレコードとしてエクスポート
Google データシートを JSON ファイルにエクスポートする方法を理解しようと、ここ数日 Openrefine を使用してきました。
JSON ファイルにエクスポートしたい次のデータがあります。
私が期待しているJSONは次のとおりです。
これまでのところ、いくつかのアプローチを試してきました。
1)Excel-to-jsonを使用していますが、単一のネストに制限されており、列名に関していくつかの制限があります
2) Openrefine とテンプレート ツールを使用していますが、いくつかの問題が発生しました: - それらは openrefine でレコードとして検出されますが、レコードではなく行をエクスポートするため、6 行が JSON にエクスポートされ、そのうちの 4 行には空のデータが含まれます - 試してみると列に入力すると、6行がJSONにエクスポートされ、そのうち4行が重複しているため、その人と彼の家族や友人との関係が失われます
このJSON形式でなければならないこのタイプの約150,000件のレコードをエクスポートしようとしているので、どんな助けも大歓迎です。
cluster-analysis - Openrefine: クロスクラスター 2 データセット
タイトルとその他の情報を含む 2 つのデータセットがありますが、データセット AI にはタイトルがあり、データセット BI にはタイトルと URL があります。
データセット B からデータセット A に URL を配置する必要があります。A と B で同じタイトルもあれば、そうでないものもあれば、わずかに異なるものもあります (ここに問題があります)。
したがって、似ているものを同時にマージしてクラスター化する必要があります。DBpedia と調整できることはわかっていますが、必要なのは 2 つのデータセットを "調整" することです。何らかの方法で可能ですか?
ありがとうございました。