問題タブ [openrefine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
79 参照

regex - 正規表現を使用して既存の列から新しい列を追加する

以下のデータからフォロワー数を抽出しようとしています。

text': 努力は、人がやめることを拒否した後にのみ、その報酬を完全に解放します。ナポレオン・ヒル #TruOptikhttp://t.co/pJH19C6CeP'、in_reply_to_status_id': なし、id': 464714​​440437268481L、favorite_count': 0、ソース': ウェブ'、リツイート': False、座標': なし、エンティティ': {symbols': []、user_mentions': []、ハッシュタグ': [{indices': [84, 93], text': TruOptik'}], urls': [], media': [{expanded_url': , display_url': pic.twitter.com/pJH19C6CeP', url' : , media_url_https': , id_str': 464714​​438142996480', サイズ': {大': {h': 194, サイズ変更': フィット', w': 259}, 小': {h': 194, サイズ変更': フィット', w': 259}, medium': {h': 194, resize': fit', w': 259}, thumb': {h': 150, resize': crop', w': 150}} 、インデックス': [94, 116]、タイプ': 写真'、id': 464714​​438142996480L、メディア URL': 、in_reply_to_screen_name':なし、id_str': 464714​​440437268481'、retweet_count': 0、in_reply_to_user_id': なし、favored': False、geo': なし、in_reply_to_user_id_str': なし、おそらく_機密': False、lang': en'、created_at': 2009 年 5 月金10:32:11 +0000 2014', in_reply_to_status_id_str': None, place': None}, is_translation_enabled': False, utc_offset': None, statuses_count': 19327, description': Tru Optik が Gartner Cool New Vendor for Info-Innovation に指名されるin Big Data 2014', friends_count': 187, location': Stamford, CT', profile_link_color': B39B00', profile_image_url': , following': False, geo_enabled': False, profile_banner_url': , profile_background_image_url': , screen_name': TruOptik', lang': ja', profile_background_tile': True,favourites_count': 55, name': Tru Optik Data Corp', notifications': False, url':, created_at': Wed Mar 27 18:54:41 +0000 2013', contributors_enabled': False, time_zone': None, protected ': False, default_profile': False, is_translator': False}

私はこれを試しました:

上記のコードは 294 を抽出することになっていますが、新しく作成された列には null 値が含まれています。正規表現に何か問題がありますか?

0 投票する
0 に答える
101 参照

spreadsheet - Google Refine / Open Refine: 列から行へ

これはやや単純な質問かもしれませんが、理解できないようです。

多くのオブジェクトを含むスプレッドシートがあり、それぞれに次のような多くの属性 (列ごとに 1 つ) があります (申し訳ありませんが、画像を投稿できないため、これが最善の方法です)。

…そして、各列を個別の行にしたいと思います。つまり、各オブジェクトが何度もリストされることになります。このような:

これを行う明確な方法が見当たらず、ここで答えを見つけることができませんが、おそらく正しい検索用語を使用していない可能性があります。

ご協力いただきありがとうございます。

0 投票する
1 に答える
970 参照

openrefine - データのアップロード中の絞り込みエラーを開きますか?

私は自分のデータの名前の曖昧さを解消するためにグーグルを絞り込もうとしています。ただし、CSV をアップロードするたびに、このエラーが発生し続けます。

このリンクのチュートリアルに従っていますチュートリアル

私もグーグル検索でこれに出くわし、私が直面している同様の問題に名前を付けました。

https://github.com/OpenRefine/OpenRefine/issues/670

しかし、問題を解決する方法がわかりません。ソースコードにアクセスして、言及されている行を編集する必要がありますか? もしそうなら、誰かがそれを行う方法についての指示を教えてもらえますか?

0 投票する
1 に答える
409 参照

openrefine - Refine / Google Refine を開く - 複数の列のセルを編集する

単一のコマンド/アクションを使用して、Open Refine で複数の列のセルを編集する方法を知っている人はいますか?

約 75 列のプロジェクトがあり、各列のすべてのセルに同じアクションを適用する必要があります。

たとえば、次のことを行う必要があります。

プロジェクトのすべての列。うまくいけば、すべての列に対して1つずつ手動でこれを行う必要はありませんか?

0 投票する
1 に答える
209 参照

excel - Google Open Refine (または Excel) で「20110822」のような日付をフォーマットしますか?

同じ列に 2 つの異なる日付形式を持つデータセットがあります。一部は次のようにフォーマットされています。

その他は次のようにフォーマットされます。

Google Open Refine は最初のタイプを日付として認識し、並べ替えて、それに対して他の操作を実行できるようにします。2 番目のタイプを日付にフォーマットする方法がわかりません。次の変換:

私が試みる他のほとんどすべてと同様に、エラーがスローされます。これは単純な問題のように思えますが、グーグルは役に立ちません。

0 投票する
1 に答える
88 参照

openrefine - Open Refine にハイパーリンクをインポートできません

.xlsx列の 1 つが で埋められているファイルをインポートしましたhyperlinksが、OpenRefine ではリンクが表示されず、値だけが表示されます。

  1. でのみ発生しますか、それともLinux同じことWindowsですか?
  2. そうでない場合、それらをインポートする他の方法はありますhyperlinksか?