あきやん 's journal

アニメ、ニュース、ソフトとかの備忘録。

住所検索の前処理: 統一された日本語処理の重要性

webでの住所入力って大体、バグ有りだったりする。

というよりか...日本語を扱うって事自体に、
定型処理が無いと言う、凄まじくバカらしい問題が。

あ、AIのタイトル設定が かなり、あおり文句っぽい... σ(^_^;)

欧米というか英語圏は必要が無いけど、それ以外の国は最低限必要な事だと思うけど実際、無い。

郵便局の配達検索で、頭を抱える...f(^ー^;

大昔も有ったけど、未だに変わらないのかぁ

  • 事の起こりは...外国に品物を注文したんです。

漢字圏では無いからね、住所も名前もローマ字です。

これでちゃんと送ってくるのは経験済み。
あの...2001年の、米国の貿易センタービルへ飛行機が...の頃も、同じやり方でCD-ROMを送って貰った事が有ったりします。

で、fedex(国際郵便)から日本の郵便局に。
そこで配達検索&日にち、時間指定を....と入力しようとしたら弾かれる。

「名前が一致しません」
「半角入力は出来ません」
「スペースも全角で入力してください」

そもそも海外便....英語圏で全角はあり得ない。
もちろん名前もローマ字だし空白も含めて半角で入力してるし、送り手も当然、全ての文字が半角で...

うん。入力が出来る訳が無い。
だから、海外便の検索は事実上、無理。

プログラムの処理として

日本語の、定型処理として当然有るべき決まり文句というのが、それぞれのプログラム言語の、日本語のライブラリに用意されてないんだろうな...。
だから、個別にプログラマが考える事になり...
とりあえずバグを避けたい人は、仕様という事にして逃げちゃうって事でしょうか。

だからこそ最低限、住所検索の前処理...

スペースを含めたアルファベットの範囲と半角かな及び記号は必ず日本語圏の全角に変換して...同じ名前なのに違うと認識されないよう統一する程度の「住所や名前専用の」前処理は、

最初からライブラリで用意するべきだと思う。


もちろん、日本語圏からの入力に アルファベットや半角・全角スペースや、半角かな、記号が有った場合、全角若しくは半角...いや、半角は英語圏でしか使わない*1から全角統一だね...に変換して住所録などとの齟齬(そご...食い違い)をなくす等の前処理も必要だね。

うん。結構面倒かな。
最初から有るべきなんだけど。

*1:つまり、漢字は半角に出来ないけど英語は全角に出来るから、全角で統一できる。
しかしこれって漢字というローカルな物を使ってる日本や中国だけの問題だからね...日本語での住所録には必要かと。
ただし漢字での名前には異体字があるから、かつてのサーバでの文字コードEUCだった頃とは違い、今の異体字も表示可能なUTF-8や16では問題が有るので....名前で一致しないと不可という設定そのものに問題が有る。