可読性/ Instapaperスタイルの HTML の整頓を行うための (クライアント側) JavaScript ライブラリはありますか? つまり、完全な Web ページの HTML を取得し、いくつかのヒューリスティックを使用して、見出しやサイドバーなどを削除して、コアの記事だけを残して整理します。clean(htmlPageString)のようなものを探しています。
可読性自体は JavaScript で実装されていると思いますが、そのためのライブラリはありません。
可読性/ Instapaperスタイルの HTML の整頓を行うための (クライアント側) JavaScript ライブラリはありますか? つまり、完全な Web ページの HTML を取得し、いくつかのヒューリスティックを使用して、見出しやサイドバーなどを削除して、コアの記事だけを残して整理します。clean(htmlPageString)のようなものを探しています。
可読性自体は JavaScript で実装されていると思いますが、そのためのライブラリはありません。
この JavaScript ライブラリは、あなたが探しているものに沿っていると思います。これは、 Firefox の Reader Viewを生成するために使用されるライブラリのスタンドアロン バージョンです。
私の読みによると、ユーザーの読み取りリストをJSONの形式でキューに保存する組み込みのjavascript + JSONです。時間、日付、その他の特定の情報とともに Web ページのリクエストを追跡します。