問題タブ [anonymize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - MySQL ダンプのオンザフライ匿名化
mysqldump を使用して、開発者が使用するライブ アプリケーションの DB ダンプを作成しています。
このデータには顧客データが含まれています。このデータを匿名化したい、つまり、顧客名/クレジット カード データを削除したい。
オプションは次のとおりです。
- データベースのコピーの作成 (ダンプの作成とダンプのインポート)
- データを匿名化する SQL クエリを起動する
- 新しいデータベースをダンプします
しかし、これには多くのオーバーヘッドがあります。より良い解決策は、ダンプの作成中に匿名化を行うことです。
私はすべてのmysqlsqldump
出力を解析することになると思いますか?よりスマートなソリューションはありますか?
mysql - MySQLクエリへの偽の名前データ
機密の個人情報を含むデータベースがあります。データ分析の目的で、そのデータを何人かに送信したいと思います。ただし、データの匿名性は維持する必要があります。
user
つまり、実際の名前を持つテーブルへのJOINの代わりに、JOINSを実行するための偽のテーブルを生成する方法はありますか?テーブルfakeuser
を動的に生成し、代わりにそのテーブルにJOINします。
手動で実行できることはわかっていますが、データベース全体のすべてのユーザーに対してクエリが実行されるわけではなく、動的に実行されると便利です。つまり、クエリがfakeuser
ID 23 を呼び出し、ID が存在しない場合は、どこかからランダムな名前を選び、テーブルとクエリに入力します。
MySQL がこれに対して十分な柔軟性を持っていない場合、私は他のタイプのスクリプトを介してこれを行うことにオープンです。
python - 教師あり機械学習を使用したテキストの匿名化
会社名や個人名を含むテキスト文書がたくさんあります。上記が手動で匿名化されたテキスト文書を整列させました (名前を単一の一意の文字に置き換えました)。
このコーパスを使用して、目に見えないドキュメントの自動匿名化を実行するシステムをトレーニングしたいと考えています。つまり、単語を文字に置き換えるだけです。第一の問題は、匿名化する単語を認識することであり、第二の問題は、単語を一意の文字に置き換えることです。私は二次問題を行うことができます。
Python が推奨されており、sklearn には必要なツールが含まれている必要があると考えています。
これについてどうすればいいですか?教師あり学習に関するスタックオーバーフローに関する記事はたくさんありますが、それらが私の状況と一致するかどうかはわかりません。これは解決するのがかなり簡単な問題だと思います。必ずしも完全な解決策を探しているわけではありませんが、いくつかの開始点があればよいでしょう。また、どのアルゴリズムがよりうまく機能するかについての洞察も大歓迎です。
svn - SVN ダンプを匿名化する方法
フランスでは、CNIL の勧告に対処するためにプライバシーを尊重することが重要です。
SVN プロパティsvn:author
は、リポジトリに変更をコミットしたすべての人の痕跡を保持します。
Cnil の推奨事項は、特に時間が経過し、情報がもはや重要でなくなった場合に、情報を匿名化することを前提としています。
Svn のサーバー ツールが付属しsvnadmin
てsvndumpfilter
いますが、いずれも svn:author プロパティを処理できません。
svn propset
機能は、リポジトリのローカル チェックアウトのみを処理できます。
svn propset の詳細
header - C# の pcap.net で出力 pcap ファイルをビルドするにはどうすればよいですか
C# で Pcap.net ライブラリを使用して、パケット フィールドを変更および匿名化しています。既にオフラインの pcap ファイルからパケットを読み取り、その中のいくつかのフィールドを変更しました。私の質問は、IPアドレス、MACアドレスなどのパケットのフィールドを変更した後、pcap形式で出力ファイルを作成する方法はありますか? 誰でも私を助けることができますか?
よろしくお願いします