-2

そのため、私たちの多くはビッグデータの問題について話しています。ページランク、k-means、その他の機械学習アルゴリズム、Web インデックス作成などのいくつかのアプリケーションを知っています。

他の種類のビッグデータ アプリケーションを知っている人はいますか?

4

1 に答える 1

6

これは集合知の時代です。私たちは毎日、約 250 京バイトのデータを作成しています。今日の世界のデータの 90% は、過去 2 年間だけで作成されたと推定されています。これは、データを生成している速度です! この種のデータの新しいソースは、日を追うごとに積み重なっています。

このデータは、私たち一人一人が毎日何回も外出するオンラインの足跡、気候情報を収集するために使用されるさまざまな種類のセンサー、ソーシャル メディア サイトへの投稿、デジタル写真やビデオ、テキスト メッセージ、オンライン販売/購入トランザクションから得られます。レコード、携帯電話の GPS 信号、および毎日のニュース記事が、数例を挙げると数百万台の携帯電話に配信されました。このデータはビッグデータです。

しかし、純粋な技術用語で話すと:

従来のデータベース管理ツールを使用して特定の量のデータを保存、検索、分析、共有などが困難になった場合、その大規模で複雑なデータセットはビッグデータと呼ばれます。

産業界はすぐにデータマイニングの可能性を認識しました。したがって、さまざまな小さなデータセットを個別に処理するのではなく、結合された巨大なデータセットを処理または分析することで、より多くの洞察/傾向/パターンが得られます。たとえば、タクシー代理店のタクシー予約に使用できる履歴データを使用すると、市内のどこに、どのタイプのタクシーを、1 日の何時に駐車して雇う必要があるかを高い確率で予測できます。

ビッグデータは、従来の処理方法では非常に扱いにくいものです。数十、数百、さらには数千のサーバーで実行される超並列ソフトウェアが必要になる場合があります。Google や Apple のような大規模な組織の場合、このようなサーバー クラスターのセットアップは実行可能かもしれませんが、小規模なプレーヤーには適していません。しかしその後、コモディティ ハードウェア、クラウド アーキテクチャ、およびコミュニティ主導のオープン ソース ソフトウェアの進歩により、ビッグデータの処理が下位層にも到達するようになりました。ビッグデータ処理は、独自のサーバー ルームなどを構築する代わりに、クラウドでサーバー時間を借りることができるスタートアップでさえ、ますます実現可能になっています。

ビッグデータの進歩は日々私たちに影響を与えています! Facebook の「友達の提案」でも、Google の「パーソナライズド広告」でも構いません。業界は常にデータ (実際にはビッグデータ) をマイニングして、高度にパーソナライズされたユーザー エクスペリエンスを提供すると同時に、広告主が購入する必要があるものを事前に知っている新しい種類の広告ビジネスを作成しています。

ビッグデータの実践的な例がたくさんあります。

出典:ビッグデータスピーク

于 2012-11-06T23:50:49.027 に答える