問題タブ [rune]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
string - Goでルーン文字列を反復処理するにはどうすればよいですか?
私はこれをしたかった:
しかし、str[i]
の型は ではなくbyte
( ) であることがわかりました。uint8
rune
バイトではなくルーンで文字列を反復処理するにはどうすればよいですか?
go - ルーンとは何ですか?
rune
Goの a とは何ですか?
私はグーグルで調べてきましたが、Golangは1行でしか言いません: rune
is an alias forint32
.
しかし、スワッピング ケースのように整数があちこちで使用されるのはなぜでしょうか?
以下は関数のスワップケースです。すべての<=
とは何-
ですか?
そして、なぜswitch
引数がないのですか?
&&
とはどういう意味r <= 'z'
ですか?
それらのほとんどはhttp://play.golang.org/p/H6wjLZj6lWからのものです
これは、スワップされた文字列を返すことができるようにマッピングrune
されていることを理解しています。しかし、ここでどのように動作するのかstring
正確にはわかりません。rune
byte
unicode - ngram 頻度表の作成とマルチバイト ルーンの処理
私は現在Goを学んでおり、多くの進歩を遂げています。これを行う 1 つの方法は、過去のプロジェクトとプロトタイプを以前の言語から新しい言語に移植することです。
今は、少し前に Python でプロトタイプを作成した「言語検出器」で忙しくしています。このモジュールでは、ngram 頻度表を生成し、そこで特定のテキストと既知のコーパスとの差異を計算します。
これにより、指定された ngram テーブルの 2 つのベクトル表現のコサインを返すことで、どのコーパスが最も一致するかを効果的に判断できます。わーい。算数。
Go で書かれたプレーンな ASCII 文字で完全に動作するプロトタイプを持っていますが、Unicode マルチバイト サポートで動作するようにしたいと考えています。これは私が頭を悩ませているところです。
ここに私が扱っているものの簡単な例があります: http://play.golang.org/p/2bnAjZX3r0
すべてがすでに正常に機能しているため、テーブル生成ロジックのみを投稿しました。
スニペットを実行するとわかるように、最初のテキストは非常にうまく機能し、正確な表が作成されます。2 番目のテキストはドイツ語で、2 バイト文字がいくつか含まれています。私が ngram シーケンスを構築している方法と、これらの特定のルーンが 2 バイトで構成されているという事実により、最初のバイトが切り取られた 2 つの ngram が表示されます。
誰かがより効率的な解決策を投稿したり、少なくとも修正を案内してくれたりできますか? 私はこの問題を分析しすぎているとほぼ確信しています。
私はこのパッケージをオープン ソース化し、Martini を使用してサービスとして実装することを計画しています。これにより、人々が単純な言語計算に使用できる単純な API を提供します。
いつものように、ありがとう!
go - ルーンを int に変換しますか?
string
次のコードでは、ルーンごとに反復処理を行っていますが、実際にはint
チェックサム計算を実行するために が必要です。本当に を にエンコードしてrune
から[]byte
に変換し、string
を使用Atoi
して を取得するint
必要がありrune
ますか? これは慣用的な方法ですか?
プレイグラウンド: http://play.golang.org/p/noWDYjn5rJ
string - ルーン文字列から整数へのこの変換が機能しないのはなぜですか?
私は次のコードを持っています:
私はルーンについて知っています、私はこれを解決しようとした過去数時間でそれらについてたくさん読みました...
結果は次のとおりです。
2
strconv.ParseInt: "\x002" を解析中: 無効な構文
0
文字列を整数に変換できないのはなぜですか?
どんな助けでも大歓迎です!
regex - 文字列golangの部分文字列を大文字に正規表現変換する
文字列を同じ単語の大文字に置き換える必要があります。これまでのところ、文字列を含むテキスト ファイルから部分文字列を検索し、「apple」、「Apple」、「ApPle」などの単語を「APPLE」に置き換えることができます。 "。文字列が「Is that pineapple Apple adamsApple applepie の匂いですか?」の場合に問題が発生します。私の検索キーワードは他の単語の間にあるため、検索して変換することはできません。
私の最終的な作業コード: