公務員叩きに物申す!-現職公務員の妄言 システム運用保守に、後期高齢者医療制度に、公務員叩き批判に、行政改革に、福祉行政に、ITに、WEB2.0に、SNS管理に、VBに、Scriptに、情報セキュリティに、IPネットワークに、SEOに、ほんの少し家族サービスなブログ。

  • 外字の同定作業の話。

  • Top
SEARCH

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト:
 外字の同定作業の話。

 全国の地方自治体の数は約1,800。
 47都道府県で平均すると、1広域あたり約40市町村がある計算になる。

 仮に1つの自治体に統一文字コードに含まれない1,000個の残存外字が存在するとすると、
 1広域あたりの残存外字の総数は、

 40 × 1,000 = 40,000字

 ところで、これは後期高齢者ではない若年者も含んだ全体の外字の数である。後期高齢者のみを対象とすると、より絞られるのではないかと推測できる。

 残存外字を有する日本人は全体から見れば少数であるため、その数は単純に人口に正比例すると仮定する。
 推定には統計局の平成17年度国勢調査資料を用い、その年齢階層別人口分布が平成20年度にもそのまま適用できると仮定する。
 障害認定対象者は無視し、後期高齢者をざっくり75歳以上とする。
 
 氏(名字)の外字の保有率というのは年齢に関係ない。均等に分布しているものと仮定する。
 名(名前)の外字の保有については、いわゆる人名漢字の関係で昭和23年戸籍法改正前に生まれたものしかありえない。これを後期高齢者医療制度開始時に60歳以上のものであると近似し、その範囲において均等に分布しているものと仮定する。

 後期高齢者が保有する残存外字が最大になるのは、残存外字が全て「名」に使われていた場合であり、これは残存外字総数×75歳以上人口÷60歳以上人口で求められる。
 後期高齢者が保有する残存外字が最小になるのは、残存外字が全て「氏」に使われていた場合であり、これは残存外字総数×75歳以上人口÷総人口で求められる。

 平成17年度国勢調査資料によれば、日本人総人口は125,730,148人、日本人60歳以上人口は34,060,249人、日本人75歳以上人口は11,559,258人、

 最大値は 40,000 × 11,559,258 ÷ 34,060,249 = 13,564字
 最小値は 40,000 × 11,559,258 ÷125,730,148 = 3,676字

 次に外国人を考える。

 登録のある外国人の数は平成17年度末で入国管理局HPによると2,011,555人、その年齢階層別人口分布が日本人とほぼ同じとすると、

 2,011,555 × 11,559,258 ÷125,730,148 = 184,936人

 ここで、75歳以上の短期滞在ならびに不法滞在外国人の数は無視できるものとする。
 よって後期高齢者外国人は47都道府県で平均すると、1広域あたり約3,935人がいる計算になる。

 外国人の国籍分布は年齢階層別に均一とし、漢字文化圏以外の外国人の外字は考慮しないものとする。
 全登録外国人に占める漢字文化圏外国人の割合は入国管理局HPより55.6%、漢字文化圏外国人1人あたりの文字数は氏1文字、名2文字で計3文字とする。

 外字が最大になるのは漢字文化圏外国人全員が全て異なる外字を保有していた場合で、3,935 × 3 × 0.556 = 6,563
 外字が最小になるのは漢字文化圏外国人全員が外字以外の文字による通称名を用いていた場合でゼロ。

 よって1広域あたり同定が必要な後期高齢者の外字数は

 最大で、13,564(日本人)+ 6,563(外国人)= 20,127字
 最小で、 3,676(日本人)+ ゼロ (外国人)= 3,676字

 この両者の相乗平均を推測値とすると、8,601 ≒ 約8,600字である。

 仮に同定作業に費やせる期間を目いっぱいとって4ヶ月=100稼働日とすると、
 1日あたり処理が必要な数は、

 8,600 / 100 = 86字

 さて、これが実現可能かどうか、同定の結果6,400字という枠内に収めることが可能かどうかの判断は皆さんにお任せしたい。
 もちろんこれは全市町村が、後期高齢者の保有する外字のみを抽出でき、なによりも著作権等の問題がクリアされて統一文字コードが利用可能となった場合の話である。

 いうまでもないが、記事の利用は自己責任で。
 どこの誰とも分からない者の落書きに、自分の広域の運命を託すことほどナンセンスなことは無い。進むか降りるか、決断するのは貴方自身である。

** 追記 **

 この記事を書くにあたって、SNS会員のひろひろさんの全面的協力をいただいた。
 この場を借りてお礼申し上げたい。




はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: 統一文字コード, 外字,
 外字の同定作業の話。

 全国の地方自治体の数は約1,800。
 47都道府県で平均すると、1県あたり約40市町村がある計算になる。

 仮に1つの自治体に、統一文字コードに含まれない1,000個の残存外字と1,000個の外国人専用外字が存在するとすると、
 1広域あたり、同定が必要な文字数は、

 40 × 2,000 = 80,000字

 仮に同定作業に費やせる期間を2ヶ月=50稼働日とすると、
 1日あたり処理が必要な数は、

 80,000 / 50 = 1,600字

 1日の稼働時間を10時間とすると、
 1時間あたり、

 1,600 / 10 = 160字

 1分あたり約3字、1字あたり約22秒。

 さて、どうしたものですかね。
 
  
 

はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: 外字, 統一文字コード,

ナビゲーション

特集記事

カテゴリー

ブログ内検索

RECENT ENTRYS

RECENT COMMENTS

RECENT TRACKBACKS

プロフィール

現職公務員SE Author:現職公務員SE
 シスアドでセキュアドな後期高齢者医療制度SNS管理人。
 後期高齢者医療制度の資格事務担当だったはずがひょんなことで電算担当に。

HSタグクラウド

Feed Me!

公務員叩きに物申す!-現職公務員の妄言のRSSフィード

後期高齢者医療制度開始カウントダウン





リンク

中の人

FC2カウンター


公務員サイトランキング 現職公務員サイトランキング ビジネスブログランキング 人気ブログランキング - 公務員叩きに物申す!-現職公務員の妄言

スカウター : 公務員叩きに物申す!?現職公務員の妄言 はてなブックマークカウンター
  • seo

FC2 Management
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。