Follow

この中で、文字列の切り分けの部分は、人間の認識からするとだいぶ不自然なことをやっている。古典的な方法で、今もよく使われている手法としては、横書きなら縦方向のプロジェクションヒストグラムを取って、値が閾値未満になる箇所で切るとゆもの。これは文字のパーツが分かれない欧文にはある程度有効だけど、日本語では対応できない。欧文もアルファベットを1文字ずつ読んでるわけじゃないので、どちみち切り分けのパラダイムは不自然になる。

· SubwayTooter · 0 · 0 · 0
Sign in to participate in the conversation
mstdn.jp

Mastodon日本鯖です.