PHPのsimilar_textアルゴリズムを書き直す試みで、私はいくつかの異なるアプローチを試しました。すべてが適度に成功しましたが、最終的には失敗しました。
最初の試み:PHPのソースコードから書き直してみました。Cのポインターのエレガントな使用により、Scalaで作成してクリーンにすることは、一見不可能に見える同じ正確な実装になります。
2番目の試み:誰かがJavaのPHPsimilar_text()に投稿したJava関数から書き直してみました。残念ながら、その関数はJavaでは機能しないため、Scalaに移植してもかまいません。
3番目の(現在の)試み:私は現在、このJavaScript実装をScalaに変換しようとしています:http://phpjs.org/functions/similar_text/。以前JavaScriptで使用したことがありますが、正しく機能しているようです。私のScalaへの翻訳(下記)は正しく機能していません。1つまたは2つの類似性インデックス内に収まりますが、通常、PHPの対応する結果に対して100%ではありません。
def similartext(first:String,second:String) : Int = {
if (first == null || second == null) {
0
}
var pos1:Int = 0
var pos2:Int = 0
var max:Int = 0
var sum:Int = 0
var l:Int = 0
val firstLength:Int = first.length
val secondLength:Int = second.length
for (p <- 0 until firstLength) {
for (q <- 0 until secondLength) {
while(p+l < firstLength && q+l < secondLength && (first.charAt(p+l) == second.charAt(q+l))) {
if (l > max) {
println("[" + p + "," + q + "," + l + "]" + first.charAt(p+l) + " | " + second.charAt(q+l))
max = l
pos1 = p
pos2 = q
}
l += 1
}
}
}
sum = max;
if (sum > 0) {
if (pos1 > 0 && pos2 > 0) {
sum += similartext(first.substring(0, pos2), second.substring(0, pos2))
}
if ((pos1 + max < firstLength) && (pos2 + max < secondLength)) {
sum += similartext(first.substring(pos1 + max, (pos1 + max) + (firstLength - pos1 - max)), second.substring(pos2 + max, (pos2 + max) + (secondLength - pos2 - max)))
}
}
sum;
}
テスト:
(Scala)val st = similartext("apple","aple") Yields 3
(PHP)$similar = similar_text("apple","aple"); Yields 4
(Scala)val st = similartext("starbucks","stharducks") Yields 8
(PHP)$similar = similar_text("starbucks","stharducks"); Yields 8
(Scala)val st = similartext("hello earth!","hello world!") Yields 10
(PHP)$similar = similar_text("hello earth!","hello world!"); Yields 8
ここで何がうまくいかないかについて誰かが何か考えを持っていますか?