問題タブ [extrapolation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - ファイル名のコレクションからパターンを推定するにはどうすればよいですか?
入力としてサンプル ファイル名のコレクションが与えられた場合に、ファイル名パターンを外挿するためのよく知られたアルゴリズムがあるかどうかを知りたいです。次のファイル名の例を見てください。
理想的には、結果セットで最終的に得たいパターンは次のようになります。
次のような結果値であっても、出発点としては適切です。
なぜこれが必要なのですか?
ユーザーが「ファイルマスク」を入力して、受信入力ファイルをグループ化するためのバケットを定義できる既存のアプリケーションがあります。着信ファイルは各ファイル マスクに対して (順番に) 評価され、ファイルがマスクと一致する場合、ファイルはそのファイル マスクのバケットに入れられます... 最後です。
私が実装したいのは、処理された最後の X ファイル名を考慮して、ユーザーに新しいファイル マスクの提案を提示することです。完璧である必要はありません。これは単なるユーザーアシスト機能です。
使用している言語は何ですか?
私のアプリケーションは Java で書かれているので、この種の機能を実行できるサードパーティの Java ライブラリは理想的なソリューションです。そうでなければ、この問題に対するよく知られたアルゴリズムがあれば、それを自分で実装できます。
r - R の Lowess による予測 (または Loess と Lowess の調整)
データセットに記入するために、いくつかの給与データを補間/局所的に推定しようとしています。
データセットと利用可能なデータのプロットは次のとおりです。
明確な非線形性を考えると、ローカル線形推定器を介して内挿および外挿 (0 ~ 40 年の経験を入力したい) することを望んでいるので、デフォルトを に設定すると、次のようにlowess
なります。
これはプロット上では問題ありませんが、生データがありません。R のプロット デバイスが空白を埋めてくれました。を使用する方向に進んpredict
でいるように見えるため、この関数のメソッドを見つけることができませんでした。R
loess
ただし、標準的な方法を使用する (で説明したように、外挿できるようにloess
設定) を使用すると、適合はあまり満足できません。surface="direct"
?loess
predict
(給与が減らないようにするべきであるという強い理論的理由があります。ここでは、U 字型を駆動するノイズ/測定ミスの可能性があります)。
そして、 によって与えられた減少しない適合を取り戻すために、どのパラメータもいじることができないようですlowess
。
何をすべきかについて何か提案はありますか?
r - データのグリッドを超えた外挿
(x, y, z) 値のグリッドがあり、グリッドの外側にある (x,y) ポイントが与えられたときに z 値を概算できる関数が必要です。
Akima パッケージ (コード ブロック 3) を使用して問題を解決しようとしましたが、interp 関数を、グリッドを超えて外挿するために必要な linear=FALSE オプションで動作させることができないようです。
データ:
データを視覚化する (質問には必須ではありません):
Akimaパッケージを使用して質問を解決しようとする私の試み
R 3.1.3 と akima_0.5-11 を使用。
r - 補間演習の高速化
私は約 120 万回の観測で (本質的に) 約 45,000 のローカル線形回帰を実行しています。
私は基本的に、多くの企業に対して、年ごとの賃金契約、つまり機能賃金 (企業、年、地位を与えられた経験) を構築しようとしています。
私が扱っているデータ(の基本構造)セットは次のとおりです。
すべての企業の経験レベル 0 から 40 の賃金関数を構築したいと思います。
そのために、私は (@BondedDust hereの提案で) COBS (COstrained B-Spline) パッケージを使用して作業してきました。これにより、賃金契約の単調性を組み込むことができます。
いくつかの問題が残っています。特に、外挿する必要がある場合 (特定の企業に非常に若い従業員や非常に年配の従業員がいない場合)、適合度が単調性を失うか、0 を下回る傾向があります。
これを回避するために、データ境界の外側で単純な線形外挿を使用してきました-フィット曲線を外側に拡張min_exp
しmax_exp
、2つの最低(または最高)フィットポイントを通過するようにします-完璧ではありませんが、うまくいっているようですかなりよく。
それを念頭に置いて、これまでのところ私がこれをどのように行っているかを示します(私はdata.table
狂信者であることを覚えておいてください):
コードの速度を低下させている可能性のあるものに特に注意してください。それとも私は我慢することを余儀なくされていますか?
ここで遊んでみると、いくつかの小規模な確定ポジション コンボがあります。