aian
Follow

この中で、文字列の切り分けの部分は、人間の認識からするとだいぶ不自然なことをやっている。古典的な方法で、今もよく使われている手法としては、横書きなら縦方向のプロジェクションヒストグラムを取って、値が閾値未満になる箇所で切るとゆもの。これは文字のパーツが分かれない欧文にはある程度有効だけど、日本語では対応できない。欧文もアルファベットを1文字ずつ読んでるわけじゃないので、どちみち切り分けのパラダイムは不自然になる。

· SubwayTooter · 0 · 0 · 0
Sign in to participate in the conversation
mstdn.jp

メンテナンスの影響により、タイムラインの表示が前後する場合があります。処理が追いつくまで今しばらくおまちください。

過去に投稿された画像のデータ移行を実施しています。移行が完了するまでの間、一部の画像は表示できません。