問題タブ [marc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
perl - Perlを使用して、MARCファイルでISBNをGoogleブックスIDに置き換えるにはどうすればよいですか?
MARC形式の書籍データを含むファイルがあります。そのうちのいくつかの行はISBNです。これらの行を、そのISBNのGoogleブックスID(存在する場合)に置き換えたいと思います。これまでのコードは次のとおりです。最終的には行が削除されます。
perl -pe "s#ISBN(.*)#$(wget --output-document=- --quiet --user-agent=Mozilla/5.0 \"http://books.google.com/books?jscmd=viewapi&bibkeys=\1\")#mg" < 5-${file} > 6-${file}
PS:Googleは自動化ツールの使用について少し曖昧です:Books DataAPIはcurl/wgetのようなツールを推奨していますが、そのようなツールを使用するときにブロックされないようにする方法についての指示はありません。また、ToSに、ユーザーは自動クエリを送信できないという条項が表示されたと確信していますが、それを再度見つけることはできません。これは彼らのフォーラムで議論されています。
xml - 同様の XML ファイルを XSL とマージする際の問題
マージする必要がある 2 つのドキュメントがありますが、他の例ではカバーされていないようです。つまり、ノードの値を取得するには、あるレベルのノードの属性だけでなく、その下のノード レベルの属性の値にも一致する必要があります。
私はこのサンプルを取ろうとしています:
また、「データフィールド」「035」、「サブフィールド」「a」の値が一致する場合、たとえば「12345」
結果は次のようになります。
検索を行った例を使用してみましたが、どれもうまくいかないようでした。すべての結果が悲惨だったので、XSL を含めませんでした。シンプルに違いないと思って見続けていますが、まともな結果が得られていません。どんな助けや指針も大歓迎です。
ありがとう!
c# - アクセスから MARC への変換、およびその逆の変換
私は本の詳細を含むアクセスファイルを持っています。詳細を取得してそれらをマークレコードに変換する必要があり、その逆も同様です。どのように行うのが最善の方法ですか?
python - Python エンコーディング変換
UTF-8 でエンコードされた、ASCII 以外の文字を含む CSV ファイルを処理する Python スクリプトを作成しました。ただし、出力のエンコーディングは壊れています。したがって、入力のこれから:
出力でこれを取得します:
エンコード エラーの原因を教えてください。以前に同様の動作を見たことがありますか?
編集: docsで紹介されているクラスcsv
で標準ライブラリを使用しています。Python バージョン 2.6.6 を使用しています。UnicodeWriter
EDIT 2:動作を再現するコード:
入力データはこちらから入手できます(大きなファイル)。
marc - KORMARCからMARC21へのコンバーター
KORMARC(韓国語MARC)をMARC21(別名USMARC)に変換するための無料のオープンソースソリューションがあるかどうか誰かが知っていますか?
c# - MARC ファイルの操作
ライブラリのデータベース プロジェクトを作成しています。図書館のほぼすべての書籍情報は、*.mrc ファイル (MARC) に保存されている書籍レコードを無料でダウンロードできる米国議会図書館で利用できます。それらのレコードを MARC ファイルから取得し、データベースにインポートする必要があります。MARC形式の書誌レコードの読み取り、操作、出力、および変換を実装できるフレームワークを誰か提供してもらえますか? または、少なくともMARC形式をXML形式に変換できますか? C# と SQL サーバーであるアプリケーションを開発するために .net プレート フォームを使用していることに注意してください。
ありがとうございます!
python - MARC21形式で保存されたドキュメントをPythonで解析するにはどうすればよいですか
昨日、ハーバードはすべてのライブラリメタデータ(約1200万レコード)へのオープンアクセスをリリースしました
リリースの目標は「イノベーションをサポートする」ことだったので、私はデータを解析してそれで遊ぶことを探していました
12GBのtarballをダウンロードし、解凍して、それぞれ約800MBの13個の.mrcファイルを見つけます。
最初のいくつかのファイルの先頭と末尾を見ると、MARC21について少し読んだ後でも、非常に構造化されていないように見えます。
最初のファイルの最初の4kは次のようになります。
$ head -c 4000 ab.bib.00.20120331.full.mrc
誰かが以前にMARC21で作業しなければならなかったことがありますか?通常はこのように見えますか、それとも別の方法で解析する必要がありますか?
mysql - XML属性を更新するMySQL
データの読み込みでは、一部のXML属性が正しくマッピングされていないようで、これを修正しようとしていますが、MySQLによるこのXML列の処理に苦労しています。
サブフィールド(属性'code = "3"')を持つフィールド(属性'tag = "520"')のすべてのオカレンスのXML属性(値ではない)を修正したいと思います。以下のクエリは、影響を受けた0行、見つかった1行を返します。これを達成する方法に関する手がかり。
明確にするために含まれているXMLフラグメント:
元のフラグメント
結果として私が欲しいもの:
コードブロックの変更を強調表示する方法を理解できませんでした(これは、tag = "520"データフィールドのind1属性であり、関連するサブフィールド属性です)
c# - C#で文字列を操作するのに助けが必要ですか?
古い標準からmarc21xml標準に変換しようとしている非常に大きな文字列があります。
次のコード行:
次を生成します。
問題は非常に明白です。
特定の用語に対して包括的変換を実行し、それを「marc:controlfield」に置き換えます。変換プロセスの終わりに向かって、リーダー要素の処理を開始します。それが私が今いるところです。そこにあるxmlに精通している人はそれを知っています:
する必要があります:
これが完了すると、文字列の整形式性や妥当性などをテストできます。上記のように、リーダー要素の閉じ括弧を取得してxmlに置き換える方法に苦労しています。
元々、Leader要素は次のようになります。
どんな助けでも大歓迎です。
solr - MARC21 - 書誌レコード ファイル: 新しいフィールドを作成し、そこに変更された値を配置するスクリプト
値を持つさまざまなフィールドで構成される書誌レコードを含む MARC ファイルがあります。例: 著者、タイトル、発行年など。データ構造は次のようになります。
特定の機能を実装するには、たとえばフィールド 852|3 の値を次のようにレコード ファイルにコピー、変更、および書き込む必要があります。
私はこれに慣れていないので、誰かがそれを行うための最良のアプローチが何か考えているかどうか知りたいですか?
ps: MARC ファイルは SolR インデックスにインデックス化されます。インデックス作成中に変更を加える可能性はありますか?