学校向けのアプリを作っており、スケジュールが変更されているかどうかを確認できます。すべてのスケジュール変更はここにリストされています:http ://www.augustinianum.eu/roosterwijzigingen/14062012.pdf 。そのページでキーワード(EditTextに入力されているユーザーのグループ)を検索したいと思います。edittextが特定の文字列と一致するかどうかをアプリでチェックする方法を見つけたので、今はそのページのすべてのテキストを文字列にダウンロードするだけで済みます。しかし、問題は、それが単純なWebページではなく、PDFページであるということです。PDFからテキストを抽出し、そのテキストを文字列に入れて、。を使用して文字列でキーワードを検索するには、特別なPDFライブラリなどが必要だと聞きましたcontains()
。しかし、私はそれについていくつか質問があります:
このPDFはPDF-creatorで作成されており、スキャンされたページなどではありません。たとえば、テキストを選択したり、CTRL+Fを使用してキーワードを検索したりできます。それで、PDFなどを抽出することが実際に必要なのか、それとももっと簡単な方法があるのだろうか。
アプリに毎回、たとえば1時間ごとに変更をチェックしてもらいたい。それで、PDFをダウンロードして1時間ごとにテキストを抽出する必要があります(約8ページ)、それは非常に多くのジュースを消費しますか?
私がやりたいことをやってくれる図書館はたくさんあると聞きました。では、どちらを使用すればよいですか?(可能であれば、無料のものが欲しいです:))
誰かが私のコードでそれを使用する方法を私に説明できますか?(私は実際には経験がないので、plzはそれを少し簡単にしてください:))
どうもありがとうございました!!!