問題タブ [openrefine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 正規表現を使用して既存の列から新しい列を追加する
以下のデータからフォロワー数を抽出しようとしています。
text': 努力は、人がやめることを拒否した後にのみ、その報酬を完全に解放します。ナポレオン・ヒル #TruOptikhttp://t.co/pJH19C6CeP'、in_reply_to_status_id': なし、id': 464714440437268481L、favorite_count': 0、ソース': ウェブ'、リツイート': False、座標': なし、エンティティ': {symbols': []、user_mentions': []、ハッシュタグ': [{indices': [84, 93], text': TruOptik'}], urls': [], media': [{expanded_url': , display_url': pic.twitter.com/pJH19C6CeP', url' : , media_url_https': , id_str': 464714438142996480', サイズ': {大': {h': 194, サイズ変更': フィット', w': 259}, 小': {h': 194, サイズ変更': フィット', w': 259}, medium': {h': 194, resize': fit', w': 259}, thumb': {h': 150, resize': crop', w': 150}} 、インデックス': [94, 116]、タイプ': 写真'、id': 464714438142996480L、メディア URL': 、in_reply_to_screen_name':なし、id_str': 464714440437268481'、retweet_count': 0、in_reply_to_user_id': なし、favored': False、geo': なし、in_reply_to_user_id_str': なし、おそらく_機密': False、lang': en'、created_at': 2009 年 5 月金10:32:11 +0000 2014', in_reply_to_status_id_str': None, place': None}, is_translation_enabled': False, utc_offset': None, statuses_count': 19327, description': Tru Optik が Gartner Cool New Vendor for Info-Innovation に指名されるin Big Data 2014', friends_count': 187, location': Stamford, CT', profile_link_color': B39B00', profile_image_url': , following': False, geo_enabled': False, profile_banner_url': , profile_background_image_url': , screen_name': TruOptik', lang': ja', profile_background_tile': True,favourites_count': 55, name': Tru Optik Data Corp', notifications': False, url':, created_at': Wed Mar 27 18:54:41 +0000 2013', contributors_enabled': False, time_zone': None, protected ': False, default_profile': False, is_translator': False}
私はこれを試しました:
上記のコードは 294 を抽出することになっていますが、新しく作成された列には null 値が含まれています。正規表現に何か問題がありますか?
spreadsheet - Google Refine / Open Refine: 列から行へ
これはやや単純な質問かもしれませんが、理解できないようです。
多くのオブジェクトを含むスプレッドシートがあり、それぞれに次のような多くの属性 (列ごとに 1 つ) があります (申し訳ありませんが、画像を投稿できないため、これが最善の方法です)。
…そして、各列を個別の行にしたいと思います。つまり、各オブジェクトが何度もリストされることになります。このような:
これを行う明確な方法が見当たらず、ここで答えを見つけることができませんが、おそらく正しい検索用語を使用していない可能性があります。
ご協力いただきありがとうございます。
openrefine - データのアップロード中の絞り込みエラーを開きますか?
私は自分のデータの名前の曖昧さを解消するためにグーグルを絞り込もうとしています。ただし、CSV をアップロードするたびに、このエラーが発生し続けます。
このリンクのチュートリアルに従っていますチュートリアル
私もグーグル検索でこれに出くわし、私が直面している同様の問題に名前を付けました。
https://github.com/OpenRefine/OpenRefine/issues/670
しかし、問題を解決する方法がわかりません。ソースコードにアクセスして、言及されている行を編集する必要がありますか? もしそうなら、誰かがそれを行う方法についての指示を教えてもらえますか?
openrefine - Refine / Google Refine を開く - 複数の列のセルを編集する
単一のコマンド/アクションを使用して、Open Refine で複数の列のセルを編集する方法を知っている人はいますか?
約 75 列のプロジェクトがあり、各列のすべてのセルに同じアクションを適用する必要があります。
たとえば、次のことを行う必要があります。
プロジェクトのすべての列。うまくいけば、すべての列に対して1つずつ手動でこれを行う必要はありませんか?
excel - Google Open Refine (または Excel) で「20110822」のような日付をフォーマットしますか?
同じ列に 2 つの異なる日付形式を持つデータセットがあります。一部は次のようにフォーマットされています。
その他は次のようにフォーマットされます。
Google Open Refine は最初のタイプを日付として認識し、並べ替えて、それに対して他の操作を実行できるようにします。2 番目のタイプを日付にフォーマットする方法がわかりません。次の変換:
私が試みる他のほとんどすべてと同様に、エラーがスローされます。これは単純な問題のように思えますが、グーグルは役に立ちません。
openrefine - Open Refine にハイパーリンクをインポートできません
.xlsx
列の 1 つが で埋められているファイルをインポートしましたhyperlinks
が、OpenRefine ではリンクが表示されず、値だけが表示されます。
- でのみ発生しますか、それとも
Linux
同じことWindows
ですか? - そうでない場合、それらをインポートする他の方法はあります
hyperlinks
か?