FC2ブログ

公務員叩きに物申す!-現職公務員の妄言 システム運用保守に、後期高齢者医療制度に、公務員叩き批判に、行政改革に、福祉行政に、ITに、WEB2.0に、SNS管理に、VBに、Scriptに、情報セキュリティに、IPネットワークに、SEOに、ほんの少し家族サービスなブログ。

  • フリガナ

  • Top
TAGWORD

 通りすがりのSEさんから、先日の記事に関してコメントをいただいた。

 内容はともかく、こうしたコメントは大歓迎である。
 役所の電算システム事情について、知っていただくきっかけにもなるだろう。

http://genshoku.blog69.fc2.com/blog-entry-160.html#comment322

 手違いか、別の記事にコメントされてしまっているため、改めて記事上で回答したいと思う。

>市町村から提供のあった各種データ=マスタデータですが、
>マスタデータを直接変換するというのは普通は危険すぎて行わないと思います。

 なぜ変換を行うのが危険すぎるのか良く分からない。
 フリガナは、外国人のフリガナの記事やまたまたフリガナの話の記事でも述べている通り、法定記載項目ではないし、統一基準もない。
 もともとが事務効率化のためにつけられているものであるから、広域連合においても事務効率化の目的において統一基準で設定されるべきであろう。
 そのための変換である。

 そもそも多くの市町村ではフリガナは半角で保有している。
 今回においては全角で提出する必要があるため、市町村において必要な変換処理をかけているはずだ。
 この時点で既に市町村住基システム等のフリガナ(マスタ)からの原本性は失われている。

>  元のシステムが「シ゛ョン スミス」のような「゛」(濁音)の単独入力を許可するシステムであれば
>  例えば「あ゛」のような「濁音2文字を1文字」に置換できない例外を想定して設計するのが常識でしょう。
>  当然、まともなSEであれば「あ゛」入りの文字列を検索するために、「゛」が単独で入力可能なインターフェースを設計すると思われます。

 まず、全国の市町村の住基システム等の多くがフリガナを半角で保有していることを考慮せねばならない。
 半角カナの場合、当然、濁点は1文字、濁音は2文字で表現される。

 しかし、求められたインターフェースは全角である。
 「ジ」を全角に変換する際に「ジ」にしたベンダと、「シ゛」にしたベンダがいる。ただそれだけのことだ。

 とはいえ、フリガナというものの用途と入力しやすさを考えれば、「ジ」と「シ゛」のどちらが正解かはおのずから分かりそうなものだが、かつて独自キーボードでインターフェースにこだわりつづけたあの会社が、まさかこんな(以下自粛)
 もちろんこれは、しっかりとした要求を出さなかった側にもおおいに責任がある。

 話がそれた。
 ともあれ、「ジ」と「シ゛」の違いはデータ変換の仕様の問題であり、キーボードからとても入力しにくい全角の「゛」をわざわざ用いる奇特な職員が全国に大勢いたわけではない。
 標準システムのフリガナ入力が寛容であるのは別の理由(多様な外国人のフリガナ)による。

>  (1)「あ゛」を職権によって訂正できるのか
>  (4)既に亡くなられた方はどういう扱いにするのか

 「麻生」が「ア゛ソウ」となっていれば、「アソウ」の入力間違いであることは明らかである。法定記載項目でもないため、職権で「アソウ」に訂正してもなんら問題はない。
 もちろん「宏史」の「ヒロシ」を、「ヒロフミ」や「コウジ」に訂正する場合は全く話が別である。

>  (2)本人にいちいち読み方を確認できるのか

 「麻生さん、あなたのフリガナの「ア」の後ろに濁点が入っているんですが、取っていいですか?」と電話したら、「そんな電話かけている暇があったら仕事しろ!税金ドロボー!」と麻生さんに言われることだろう。
 もちろん銀行振込の口座事故等、フリガナが極めて重要な意味を持ち、是が非でも確認すべきシーンはある。

>  (3)読み仮名に「あ゛」を使ってはいけないというルールがあるのか

 使っていけないというルールはないが、むしろそういう使い方をすることが運用上あるかどうかを考慮すべきだろう。
 フリガナで検索するときは、他の主キー(個人番号や被保険者番号)が分からないときである。
 電話での聞き取りや、書類上の漢字氏名から、ディスプレイ上のフォームに「あ゛」を入力するケースがあるかどうか?
 それを考えれば「あ゛」の文字列を含むレコードの存在が有害かどうか、おのずから分かるはずだ。

> (2)運用上の問題
>  市町村から提供のあった各種データを変換するバッチ処理のタイミング。
>  市町村から提供のあった各種データを次の日の営業開始までに必ず変換が終わることを
>  保障できません。「外国から1万人の長期出張中の老人が転入してきたらどうする?」

 差分異動データはせいぜい月数千件、大型広域でも1日100件あるかどうかのレベルである。
 「外国から1万人の長期出張中の老人が転入してきたら」システム云々以前に窓口と入国管理局がパンクするだろう。(そしてネットワークも)
 そして、皮肉を言っているつもりはないのだが、外国から1万人の長期出張中の老人が転入することを想定してシステム設計が出来るほど、自治体の財政は潤沢ではない。

 もちろん運用上の問題は大きな懸案である。
 だが、データ件数やレコード長も聞かずに「保障できません」というのは、SEとしての姿勢に問題があると言わざるを得ない。

> (3)解決策
>  (1)データベース側での解決
>    「ジ」が入力されたときに「シ゛」と「ジ」を検索するようにする。
>  (2)インターフェースでの解決
>    「あいまい検索」のような機能を作りこみ「ジ」が入力されたときに「シ゛」と「ジ」を検索するようにする。
> ⇒いずれの方式もDBアクセスが数倍になるため、ハード設計からやり直しとなり、不可能と思われます。

 元データを変換出来ない場合でも、アクセスを数倍にする必要はなく、あらかじめ検索専用のDBをもう1つ作っておけば良いだけジャマイカ?
 マスタのフリガナ(元データと同じ)に加えて、変換済みの検索用のフリガナを別に保有させ、紐つけておくのである。
 つまり外部データ取り込み時に「シ゛」「ジ」どちらの入力があっても「ジ」で検索専用のDBに登録するようにし、オンラインインターフェースからの入力も同じ変換をかけて、検索専用のDBを参照するという方法は、無理なく導入可能だと思われる。

 いずれにせよ、元データを変換出来ないという制約はない。
 自分が開発に関与できる立場であれば、2文字の濁音をSQLで1文字に統合し(たかだが数十通りである)、かつ統合できないものがある場合には濁点のみを抹消してそのレコードを特定できるログを出すように、要求を出すだろう。
 後ほどログを確認し、支障があればオンラインで修正する。それだけのことである。

 後期高齢者医療制度開始まであと206日!



** 9月9日追記 **

 SEの姿勢云々については言い過ぎだったと少し反省。
 ただ、要求を出す側の立場とすれば「詳細を聞かずに出来ないとは言って欲しくないなぁ」という気持ちがあることは理解していただきたいと思う。

 「SQL」云々については自分の書き方がまずかった、というかトンチンカンな文章だった(汗

 外部ファイルをインポートしてからDBのテーブルにupdate文を実行するということではなく、テーブルにインポートする前の外部ファイルにバッチ処理で項目の変換を施す、ということがいいたかった訳である。

>マスタデータを直接変換するというのは普通は危険すぎて行わないと思います。

 のくだりが提出されたデータの原本性云々の話ではなく「直接テーブルにupdate文を実行するのが危険」という趣旨であるならば、それは良く分かる。(やれと言われて、恐る恐るやったことはあるが)

 件のシステム(後期高齢者医療の標準システム)の根幹仕様については、テーブルも含めほとんど公開されていないので、
 テーブルに対して直接update文を実行するのはそもそも不可能であるし、同様に、あいまい検索機能を作りこんだり、検索画面のフォームから入力された内容に同じ変換をかけるようなカスタマイズも不可能だ。

 なので、できることはせいぜいインポート前に最低限の変換をかけるぐらいではないか、と。

 既に登録されているDBについては、2回目のセットアップのときに全部破棄される(と筆者は理解している)ので、考慮はしていない。



** 9月20日追記 **

 9月12日付で名寄せのロジック向上ツールがリリースされたようであり、そのせいか名寄せに用いられていたフリガナは下記イチゴウさんのコメントにあるような清音処理がなされていたとの報告があった。
 気になる木さん、GJである。

 ただ、オンライン検索時に同様な恩恵が受けられるかどうかは未確認。更なる作りこみを期待したい。

スポンサーサイト




はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: フリガナ, DB, インターフェース,
 実際、筆者が端末に触れたわけではなく、SNS会員の書き込みからの勝手な邪推であると前置きするが、断片的な噂話だけでもそう確信できるのだ。

 まず資格管理の画面展開に世帯という概念がない。

 国保や老人保健の事務が、常に世帯単位で状況を把握しながら行わなければならないことは言うまでもないが、
 それ故に、市町村の国保や老健システムは、世帯→個人という単位で画面が展開するものが多い。
 たとえ検索画面からダイレクトに個人画面が展開する仕様であっても、容易に同一世帯員に遷移できる工夫がなされているのが普通だ。

 これは後期高齢者医療制度においても同様であるが、ver1.0にはそうした工夫が一切ない。
 世帯単位の画面は存在せず、個人画面が展開後、他の同一世帯員を表示させるためには、最初から検索を行わなければならない。

 ならば、世帯番号で検索すれば…ということなるが、展開後の個人画面ではTABキーによる移動では世帯番号欄にカーソルがいかないうえ、右クリックも利かないため、操作する職員は、以下のような操作を頻繁に強いられることになる。

1.検索画面から個人画面を展開
2.個人画面にてマウス操作で世帯番号をドラッグ→ctrl+Cでコピー
3.検索画面に戻る
4.世帯番号をctrl+Vでペースト
5.他の同一世帯員の個人画面を展開

 マウスとキーボードを交互に操作しなければならないわけで(以下省略)。
 あと、マウスを操作しにくい障害を持った人とか、アクセシビリティ面でも(以下省略)。

 更に言えば、個人単位の検索にも難がある。
 前々から口を酸っぱくして訴えているが、フリガナに関する諸問題を放置し、統一基準や規格を作成することを避けているためだ。

 フリガナは住所地特例対象者の名寄せでも大きな問題となっているが、むしろ台帳に登録された後の方がはるかに大きな障害となりうる。
 現実問題、「ジョン スミス」をフリガナのみで確実に検索するためには、以下の4通りを試さなければいけない。

1.ジョン スミス(濁音1文字、拗音小文字)
2.ジヨン スミス(濁音1文字、拗音大文字)
3.シ゛ョン スミス(濁音2文字、拗音小文字)
4.シ゛ヨン スミス(濁音2文字、拗音大文字)

 仮に生年月日と組み合わせて、ワイルドカード等の正規表現検索が可能としても(しかしながら、これは住基ネットで散々批判を浴びたことを忘れてはならない)、1文字目が濁音であれば2通り試さなければいけない。
 暴論を言えば、検索に2倍の時間がかかる=人件費2倍である。

 こんな状態でまともな事務が(以下省略)
 ていうか、検索時に「゛」を入力しなければならないインターフェースって(以下省略)

 真面目な話、各広域はこうしたフリガナの乱れや揺らぎを防ぐための対策を講じた方が良いだろう。

 そんなに難しい話ではない。
 市町村から提供のあった各種データにSQLをかけて、濁音2文字を1文字に、拗音や促音の小文字を大文字に置換するだけである。(あとはズとヅ、ヂとジ、オとヲなどの揺らぎをどう考えるか)
 どこかのベンダが他に先んじてそういうモジュールを作れば、確実に全国の広域に売れるだろう(と煽っておく)。何しろ人件費2倍を防止できるのだから。

 まあ、辛らつなことをいろいろ書いたが、ver1.0はα版という理解で、正式版では改良されていることを期待する。
 気になる木さんは、現場の意見に真摯に耳を傾け、こうした細かい部分にも配慮していただきたいものである。

 後期高齢者医療制度開始まであと211日!

はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: ユーザビリティ, アクセシビリティ, 標準システム, 住基ネット, フリガナ,
 そもそも名前のふりがなって(ある地方公務員電算担当のナヤミ)
 名前のふりがなって難しいのです(ある地方公務員電算担当のナヤミ)

 alittlethingさんがフリガナについて明晰に語られているので、それに便乗。

 【ウェブ魚拓】年金氏名 自動読み仮名ソフト導入 入力ミス誘発、システム欠陥(Sankei WEB)

 alittlethingさんのブログでも引用されている上記の記事では、まるでフリガナが不正確なのがいけないような物言いだが、それは筋違いである。
 実際、自治体の管理するフリガナはかなり不正確(?)であるわけだが、それ自体が何か問題があるわけではない。

 何がいいたいかというと、自治体はそれぞれ独自の基準でフリガナを保有しているということなのだ。

 例えば「加持 リョウジ」という氏名のフリガナは、自治体によって「カジ リョウジ」だったり「カシ リョウシ」だったり「カジ リヨウジ」だったり「カシ リヨウシ」だったりする。
 「渚 カヲル」「ナギサ カヲル」だったり「ナギサ カオル」だったり「ナキサ カヲル」だったり「ナキサ カオル」だったりする。
 「ヅ」「ズ」「ヂ」「ジ」を区別しない(置き換えている)自治体もある。

 これらは検索時のマッチ率向上、ゆらぎ防止のために(要するに事務効率向上のために)自治体が独自にフリガナを加工しているもので、その仕様は自治体ごとにまちまちである。

 住基ネットの際にフリガナの統一基準が作られたのかと思ったが、どうやらそうではなく、各自治体がこバラバラの基準のフリガナを勝手に住基ネットに登録しているらしい。
 住基ネット批評で有名なほら貝では、住基ネットの過剰な検索機能を批判しているが、こうした仕様が導入された背景には、フリガナの統一性の無さが無縁ではないのかもしれない。

 外国人登録の方は更にバリエーション豊かとなる。

 数が少ないからという理由でフリガナを保有しなかったり、冒頭1文字しかフリガナを保有しない自治体が存在する。これは、事務に必須でない情報は保有しないという、個人情報保護の原則に叶っている。
 漢字圏以外はアルファベットで保有している市町村もある。検索の速さや正確性という観点からすれば、アルファベット表記の氏名に無理にカタカナの読みをつけるよりもはるかに合理的である。

 フリガナは、各自治体が検索のために(言い換えれば事務効率の向上のために)任意で保有しているものである。
 逆に言えば、住民票の写しや外国人登録済証明書が迅速に交付できるなら、フリガナなどなくても構わないし、デタラメでも良いのである。

 問題なのは、統一基準がないものをベースに突合や名寄せを行おうという手法にある。
 そういえばどこかのシステムも、住所地特例の名寄せを「カナ氏名」「生年月日」「性別」の3点マッチでやろうとしているようだが(以下自粛)
 ましてやデタラメの可能性が非常に高いものを公的な被保険者証(以下自粛)



 そもそも正しいフリガナとは何であろうか?
 統一基準がないものについて、正しいとか不正確とか言う事自体がナンセンスであるとも思うが、「俺のフリガナは○○だ!」と本人が自己申告したものを正しいと仮定することは可能であろう。

 実は、全員ではないが、本人申告のフリガナ情報を(日本人外国人の区別無く)老人保健担当課は必ず保有している。
 セットアップ時に広域に提供する老人保健情報ファイルの項目を1つずつ見ていけば、必ずそれは見つかるはずである。

 もちろん、それを氏名や通称名のカナとしてセットして良いか否かはまた別問題である。



はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: 住基ネット, フリガナ, 住民基本台帳, 外国人登録, 名寄せ, 個人情報保護,
 そんなものは設定できるはずがない。
 
 いうまでもなく、フリガナは外国人登録法第4条に記載がない。
 システム上管理していない場合もあるし、もしあったとしても、市町村担当者が検索のため便宜的に付けているものであり、外部に提供、ましてや被保険者証という公的証明書に搭載することを想定して付けられているものではない。

 システム上の仕様うんぬんという次元の問題ではない。
 これは政府や他の官庁をも巻き込んだ国際問題になる可能性も秘めているのだ。

 「金」という氏の後期高齢者がいるとする。
 彼の氏は「キン」と読むかもしれないし、「キム」と読むかもしれない。
 あるいは、普段は「ミズノ」と呼ばれているが、その呼称を役所に届けていないだけなのかもしれない。(そして「キン」や「キム」と呼ばれることを甚だ嫌っているかもしれない)

 あたりまえの話であるが、我々が広域への提供データに「キン」という文字列を含めるのであれば、その呼称がそのまま医療機関の窓口で使われるリスクを勘案せねばならない。

 その結果発生したトラブルについて、なんとか省なんとか室や、気になる木のコールセンターに電話をすれば、担当者がすぐに現場に駆けつけて説明を行ってくれる。――そういう仕組みであれば、我々は喜んでフリガナを差し出そう。

 だが、現実はそうではない。

 後期高齢者医療制度は自治事務である。
 フリガナを提供した結果については、全て自分達が責任を取らねばならないのだ。


 どうしても出せというのであれば、無意の文字列、例えば全桁「ア」で埋める等の対応を行うべきであろう。
 医療機関において、外国人のフリガナが被保険者証に無かったとしても診療報酬が請求できないわけではないのだから、それで誰も困るわけではない。
 
 もし今後の医療のグランドデザインに外国人のフリガナが必須であるというのであれば、まず厚生労働省が全国の自治体の外国人登録窓口におけるフリガナの扱いについて、法務省と協議を行うべきである。
 外国人登録法の改正を行うか否かはともかくとしても、少なくとも法務省と連名で、フリガナの付け方に関する統一のガイドラインを示すべきであろう。

 自治体が外国人のフリガナを外部提供し、データベース化が行われるのは、そうした手順を踏んでからの話である。


はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: 外国人登録, フリガナ, 被保険者証, QRコード, 厚生労働省, 法務省,

ナビゲーション

特集記事

カテゴリー

ブログ内検索

RECENT ENTRYS

RECENT COMMENTS

RECENT TRACKBACKS

プロフィール

現職公務員SE Author:現職公務員SE
 シスアドでセキュアドな後期高齢者医療制度SNS管理人。
 後期高齢者医療制度の資格事務担当だったはずがひょんなことで電算担当に。

HSタグクラウド

Feed Me!

公務員叩きに物申す!-現職公務員の妄言のRSSフィード

後期高齢者医療制度開始カウントダウン





リンク

中の人

FC2カウンター


公務員サイトランキング 現職公務員サイトランキング ビジネスブログランキング 人気ブログランキング - 公務員叩きに物申す!-現職公務員の妄言

スカウター : 公務員叩きに物申す!?現職公務員の妄言 はてなブックマークカウンター
  • seo