問題タブ [document-management]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - 3 万ドル未満の拡張可能な .Net ドキュメント管理
私は、販売スタッフが予算内で販売しようとして開発者に与えることがある問題の 1 つに答えようとしています。
以下を必要とするクライアントがいます。
- AD 認証をサポートするドキュメント管理システム (サーバーが別の場所にある場合でも、VPN 上にある可能性があります)
- 約 2000 のドキュメントを一括インポートする機能 (PDF や Word ドキュメントなどとしましょう)
- 一部のドキュメントを「外部」としてマークし、「ダウンロード」セクションにドキュメントが表示されるように、Web サイトの一部を作成できるようにする必要性
- かなり良い権限管理
- .Net と MSSQL で書かれているので、必要に応じて (API を介して、または直接) 参加して遊ぶことができます。
- 非常によく文書化されており、1 か月か 2 か月以内にすぐに導入してロールアウトを完了することができるサポート。(DM 以外にも多くのことを行う必要があります)
外部ソフトウェアの予算はすべて 30 ~ 40,000 ドルになります。
ソフトウェアの予算とタイムラインが少し苦しいので、これは不可能なタスクのように聞こえますが、それは仕事であり、追加の開発と実装 (インポートは言うまでもありません) のための予算が必要です。ソフトウェアですが、同じレベルの機能セットと美しさを提供するカスタム ソリューションに支払うには十分ではありません
php - 文書管理アプリケーションでの文書の重複および類似文書のチェック
更新: ssdeep C API 用のphp_ssdeepという PHP 拡張機能を記述して、PHP でネイティブにファジー ハッシュとハッシュ比較を容易にします。詳細については、私のブログを参照してください。これが人々に役立つことを願っています。
私は、さまざまなファイル形式 (場合によっては数千のファイル) を格納する Linux ボックス上の PHP でカスタム ドキュメント管理アプリケーションを作成することに関与しており、データベースでの重複を防ぐために、テキスト ドキュメントが以前にアップロードされたかどうかを確認できるようにする必要があります。 .
基本的に、ユーザーが新しいファイルをアップロードするときに、重複しているか類似のコンテンツを含むファイルのリストを提示できるようにしたいと考えています。これにより、既存のドキュメントの 1 つを選択するか、独自のドキュメントをアップロードし続けることができます。
類似の文書は、その内容を調べて類似の文と、おそらく動的に生成されたキーワードのリストを調べることによって判断されます。次に、一致率をユーザーに表示して、重複を見つけやすくします。
このプロセスに推奨するパッケージと、過去にこれをどのように行ったかについてのアイデアはありますか?
すべてのテキストコンテンツを取得することで、直接複製できると思います。
- 空白の除去
- 句読点の削除
- 小文字または大文字に変換
次に、MD5 ハッシュを形成して、新しいドキュメントと比較します。これらの項目を取り除くことで、たとえばユーザーが文書を編集して余分な段落区切りを追加した場合に、重複が見つからなくなるのを防ぐことができます。何かご意見は?
このプロセスは、夜間のジョブとして実行される可能性もあり、計算要件が大きすぎてリアルタイムで実行できない場合、次回のログイン時にユーザーに重複を通知できます。ただし、リアルタイムが優先されます。
.net - .NET ドキュメント管理システムの設計 - パフォーマンスに関する質問
次の仕様で基本的な .NET ドキュメント管理システムを開発する必要があります。
データは移植可能で自己完結型である必要があるため、ドキュメント (一般的な形式には Word、PDF、Excel、および Powerpoint が含まれます) をバイナリ データにシリアル化します。次に、バイナリ データを SQL Server 2005 データベースに格納します。ユーザーがドキュメントをダウンロードする必要がある場合、システムはバイナリ データを逆シリアル化し、元の形式で表示します。
平均行サイズは 200k を超えることはできません。
3 年間、毎月最大 500 件のドキュメントがアップロードされる予定です。
データベースのサイズが 6 GB を超えることはないと考えています。
同時にシステムにアクセスする可能性のある最大のターゲットは 20,000 人です。
私の質問は次のとおりです。確かなパフォーマンスを提供し、サイトのダウンタイムを防ぐために、テクノロジーはどの程度堅牢である必要がありますか?
私は初心者の開発者であり、この種のアーキテクチャと設計に慣れていません。
content-management-system - DMSにAlfrescoまたはNuxeoを選択するのに役立ちます
いくつかの初期要件を備えたDMS(ドキュメント管理システム)を開発する必要があります。
- 可能であれば、DMSはオープンソースである必要があります
- 最初に、DMSは最大500人のユーザーをサポートする必要があります
- システムは、ユーザーまたはコンテンツの意味でスケーラブルである必要があります
- Docuemtns/Contentはファイルシステムに保存する必要があります
- ドキュメントは、後で破棄するためにマークを付けることができる必要があります
- ワークフロー機能が必須
- バージョン管理機能が必須
- LiferayポータルでSSO(シングルサインオン)ができてうれしいです
- Liferayのポートレットを介して機能の一部を公開する可能性があるのは素晴らしいことです
- ドキュメント管理は、Webインターフェイスを介して実行する必要があります
- 共有ドライブ機能があるのはいいことです
- コンテンツの追加/変更に関するイベントや通知があると便利です
現時点では、AlfrescoとNuxeoのどちらを選択するか迷っています。
私はそれらの間で選択する助けをいただければ幸いです。
前もって感謝します
java - Objective-Java統合ライブラリは存在しますか?
注:これはObjective-Cの質問ではなく、Objective-cとは関係ありません。
Re:目的:ドキュメント管理システム。http://www.objective.com/
私は、レコード管理目標バージョンと対話するためのライブラリを求めています。7システム。ファイルをダウンロードして、目的のファイルに保存したいと思います。
このWebサイトでは、サードパーティソフトウェアとの統合については何も言及されていません。そして、私の友人のグーグルは、他の多くの無関係な「客観的な」アイテムと一致します。
そのようなライブラリはどこにありますか?また、可能であればドキュメントもありますか?
mysql - Alfresco CMS を使用する際にドキュメントを DBMS に保存する理由は何ですか?
ドキュメント管理システムの実装を希望している企業とのインターンシップの面接があり、彼らはそもそもオープンソース ソリューションを検討しており、彼らの最優先の選択肢は Alfresco ですが、決定はまだ最終的なものではありません。調査する私の仕事の一部はAlfresco が最適なソリューションです。
プロジェクトの説明から私が見たのは、彼らはMySQLデータベースでAlfrescoを実装し、ドキュメントのメタデータとインデックス作成のためだけにDBMSを使用するのではなく、実際にはドキュメントを内部に保存したいということです. 会社概要によると、ドキュメントの種類は主に PDF と .doc であり、画像ではありません。
私は少し調査しましたが、質問を複製するのではなく、ファイルをデータベースに保存することに関連するすべてのトピックをここで読みました。したがって、私が理解していることから、BLOBS を保存することは一般的にお勧めできません。また、会社のプロファイルとアーカイブに関する法的義務により、より多くのドキュメントを保存する必要があることがわかります。
面接のためにできる限りの準備をしたいと思います。そのため、これらの質問に対するあなたの意見をお聞かせください。
ドキュメントを DBMS に保存することに決めた理由は何ですか? (特に、ファイルを FS に保存する Alfresco をインストールしていることを考慮して)???
特にMySQLデータベースにドキュメントを保存した経験はありますか???
私は面接がとても楽しみで、このインターンシップを本当に望んでいるので、これは私が本当に理解したいことの 1 つです!!
ありがとうございました!!!!
web-applications - バーコードは、Web アプリ用にデジタル化する必要がある物理的なドキュメントを一意に識別するための最良の方法ですか?
数千の物理ドキュメントをデジタル化し、それらを表示する Web アプリのさまざまなカテゴリに割り当てる必要があります。
ドキュメントを一意に識別するために、ドキュメントごとにバーコードを生成する必要がありますか?
その場合、スキャンした画像にバーコードが含まれないようにするにはどうすればよいですか?
これにアプローチするための他の推奨事項はありますか?
document - Alfresco Document Management はすべてのファイル タイプをサポートしていますか?
簡単な質問....
ここで dms を決定しようとしていますが、Alfresco が推奨されています。
Alfresco Document Management はすべてのファイル タイプをサポートしていますか?
ありがとう!
ruby-on-rails - ドキュメント検索の実装に使用した言語、フレームワーク、テクノロジーは何ですか?
私は新しい会社にいますが、私たちの目標の 1 つは、チームとクライアントのためにドキュメント検索ポータルを実装することです。Salesforce やクラウド内の他の ECM などの外部サービス プロバイダーを使用すると、将来的に多くの統合作業が発生するのではないかと少し心配しています。クライアントの観点から見ると、これらのドキュメントは、構造化されたコンテンツ (MS Word ドキュメントではなく、DB に保存されます) と同じバケットにも存在します。
ドキュメント検索を実装している場合、どの言語、フレームワーク、テクノロジーを使用しましたか? 失敗談はありますか?すぐに使用できるものを使用するのに問題はありませんが、ドキュメントとドキュメントにアクセスするための API を制御できることが重要だと思います。フルカスタムするならRailsを使いたいです。
vb.net - 非表示の共有を使用して文書管理構造を作成するための設計提案
ソフトウェアにドキュメント管理機能を追加する必要があります。ドキュメントは、会社名とプロジェクト名でグループ化されます。
フォルダーは、クライアント/プロジェクトの ID 番号を使用してアプリケーションからアクセスする必要がありますが、Windows エクスプローラーを使用してエンド ユーザーが簡単に参照することもできます。
クライアントとプロジェクトはデータベースに保存されます。
ソフトウェアにフレンドリ名を使用してフォルダーを作成させ、ソフトウェアがファイルにアクセスするための ID 番号を持つ非表示の共有を使用することを考えています。
フォルダ構造はこのようなものになります
したがって、上記の例では、ID が「1234」の「Company 1」という会社があります。
Windows エクスプローラーを使用してフォルダーを参照すると、ユーザーに表示される
\\ServerName\Documents\Company1
から同じフォルダにアクセスすることもできます
\\ServerName\Documents\Company-1234$
隠し共有を使用することで、会社名が変更されたり、何らかの理由で名前が変更されたりしても、変更されない ID に基づいて隠し共有を使用するため、アプリケーション内のリンクが壊れることはありません。
サーバー上に数百 (場合によっては数千) または非表示の共有があると、パフォーマンスが大幅に低下しますか?
この機能を提供するための提案や代替手段はありますか?