公務員叩きに物申す!-現職公務員の妄言 システム運用保守に、後期高齢者医療制度に、公務員叩き批判に、行政改革に、福祉行政に、ITに、WEB2.0に、SNS管理に、VBに、Scriptに、情報セキュリティに、IPネットワークに、SEOに、ほんの少し家族サービスなブログ。

  • 統一文字コード

  • Top
TAGWORD

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト:
 オープンソースの話でalittlethingさんから著作権がらみのトラックバックをいただいたのがきっかけで気づいたのだが、
 例の未定稿にこういうくだりがある。

 本方式については,現在検討中のものであり,今後著作権などに関して関係する省庁などとの調整等を踏まえて実現可否を決定することになります。

 そういえば某SNSでも「住基ネット外字の版権は…」と言及していた会員がいた。
 果たして文字コードや外字に著作権があるのであろうか。

 もしそうであるならば、外字を広域連合に提供して同定作業を行うこと自体、いろいろ面倒な事前調整が必要であることになる。
 いやそもそも、外字自体に著作権があるのならば、その外字が用いられている住民票の写しなどの印刷物をコピーすることに著作権法上の制約が発生するであろう。
 そんなことがあるのだろうか。

 過去には字面(タイプフェイス)には著作権が認められないという判例がある。
 一方で、外字のデジタルフォントには著作権が存在するという判例もある。
 http://www.kondolaw.jp/hanrei_font.html

 では、住基ネットの統一文字コードの場合はどうなのであろうか。

 ややこしいので、ここでひとまず用語を整理しよう。
 
 字面(タイプフェイス)というのは、特定の文字の見た目である。表現形式ということもできる。
 例えば「字」という漢字は明朝体的な表現も出来るし、ゴシック体的な表現も出来るし、筆記体や毛筆体にも出来る。
 しかし文字としてはいずれも「字」であり、字面によって文字の本質(意)が変化するわけではない。

 そしてあらゆる文字に対応する字面の一式が、いわゆるフォントである。

 一方で文字コードというのは、電算処理されるバイナリ(二進数)コードとそれに対応する文字を結びつける規格、決まりごとであり、JIS、SHIFT-JIS、Unicodeなどが代表的な文字コードである。
 が、その文字がどのような字面であるかは文字コードではなくフォントで決まるわけである。

 未定稿などで取沙汰されてきたのは文字コードのことについてであるが、
 実際我々が被保険者証や賦課決定通知書を作成するためには文字コードだけでは成しえない。
 文字コードによって指定される文字の字面を各種出力装置(ディスプレイやプリンタなど)に出力するためのプログラム群やデータ群が必要である。
 要するに、これがデジタルフォントである。

 プログラムはいうまでもなく著作物である。それは著作権法第2条にも明記があるし、それを登録するための専用の法律や、団体もある。
 構成要素としてプログラムを有するデジタルフォントには、当然著作権が存在する、という論理であり、
 現に我々は外字ソフトウェアのライセンスを購入するという形で、そのデジタルフォントの利用権を得ているわけである。

 そう考えれば、未定稿でいうところの「著作権」も「統一文字コード」そのものではなく、それに対応するデジタルフォントたる「住基ネット明朝」の著作権のことを差し、
 「調整」というのは、標準システムに住基ネット明朝を実装するための著作権上の調整のことと考えるのが自然である。

 が、もしかすると統一文字コード自体にも著作権が存在するのかもしれない。

 規格や決まりごとに著作権があるというのは変な話だ。実際、UnicodeやUTF-8の著作権など聞いたことがない。
 だが、経済産業省はJISの著作権が日本国にあると主張している。
 この考えが著作権法上正しいのかどうか分からないが、もし是とするならば統一文字コード自体に著作権が存在してもおかしくない。
 
 ともあれ統一文字コードの件については厚生労働省が上手くやってくれることを祈るしかないが、
 実はこうした著作権の問題、最初に述べたとおり、市町村や広域も無縁ではない。

 その話については次回にしたいと思う。
 

スポンサーサイト

はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: 外字, 著作権, 統一文字コード,
 外字の同定作業の話。

 全国の地方自治体の数は約1,800。
 47都道府県で平均すると、1広域あたり約40市町村がある計算になる。

 仮に1つの自治体に統一文字コードに含まれない1,000個の残存外字が存在するとすると、
 1広域あたりの残存外字の総数は、

 40 × 1,000 = 40,000字

 ところで、これは後期高齢者ではない若年者も含んだ全体の外字の数である。後期高齢者のみを対象とすると、より絞られるのではないかと推測できる。

 残存外字を有する日本人は全体から見れば少数であるため、その数は単純に人口に正比例すると仮定する。
 推定には統計局の平成17年度国勢調査資料を用い、その年齢階層別人口分布が平成20年度にもそのまま適用できると仮定する。
 障害認定対象者は無視し、後期高齢者をざっくり75歳以上とする。
 
 氏(名字)の外字の保有率というのは年齢に関係ない。均等に分布しているものと仮定する。
 名(名前)の外字の保有については、いわゆる人名漢字の関係で昭和23年戸籍法改正前に生まれたものしかありえない。これを後期高齢者医療制度開始時に60歳以上のものであると近似し、その範囲において均等に分布しているものと仮定する。

 後期高齢者が保有する残存外字が最大になるのは、残存外字が全て「名」に使われていた場合であり、これは残存外字総数×75歳以上人口÷60歳以上人口で求められる。
 後期高齢者が保有する残存外字が最小になるのは、残存外字が全て「氏」に使われていた場合であり、これは残存外字総数×75歳以上人口÷総人口で求められる。

 平成17年度国勢調査資料によれば、日本人総人口は125,730,148人、日本人60歳以上人口は34,060,249人、日本人75歳以上人口は11,559,258人、

 最大値は 40,000 × 11,559,258 ÷ 34,060,249 = 13,564字
 最小値は 40,000 × 11,559,258 ÷125,730,148 = 3,676字

 次に外国人を考える。

 登録のある外国人の数は平成17年度末で入国管理局HPによると2,011,555人、その年齢階層別人口分布が日本人とほぼ同じとすると、

 2,011,555 × 11,559,258 ÷125,730,148 = 184,936人

 ここで、75歳以上の短期滞在ならびに不法滞在外国人の数は無視できるものとする。
 よって後期高齢者外国人は47都道府県で平均すると、1広域あたり約3,935人がいる計算になる。

 外国人の国籍分布は年齢階層別に均一とし、漢字文化圏以外の外国人の外字は考慮しないものとする。
 全登録外国人に占める漢字文化圏外国人の割合は入国管理局HPより55.6%、漢字文化圏外国人1人あたりの文字数は氏1文字、名2文字で計3文字とする。

 外字が最大になるのは漢字文化圏外国人全員が全て異なる外字を保有していた場合で、3,935 × 3 × 0.556 = 6,563
 外字が最小になるのは漢字文化圏外国人全員が外字以外の文字による通称名を用いていた場合でゼロ。

 よって1広域あたり同定が必要な後期高齢者の外字数は

 最大で、13,564(日本人)+ 6,563(外国人)= 20,127字
 最小で、 3,676(日本人)+ ゼロ (外国人)= 3,676字

 この両者の相乗平均を推測値とすると、8,601 ≒ 約8,600字である。

 仮に同定作業に費やせる期間を目いっぱいとって4ヶ月=100稼働日とすると、
 1日あたり処理が必要な数は、

 8,600 / 100 = 86字

 さて、これが実現可能かどうか、同定の結果6,400字という枠内に収めることが可能かどうかの判断は皆さんにお任せしたい。
 もちろんこれは全市町村が、後期高齢者の保有する外字のみを抽出でき、なによりも著作権等の問題がクリアされて統一文字コードが利用可能となった場合の話である。

 いうまでもないが、記事の利用は自己責任で。
 どこの誰とも分からない者の落書きに、自分の広域の運命を託すことほどナンセンスなことは無い。進むか降りるか、決断するのは貴方自身である。

** 追記 **

 この記事を書くにあたって、SNS会員のひろひろさんの全面的協力をいただいた。
 この場を借りてお礼申し上げたい。




はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: 統一文字コード, 外字,
 外字の同定作業の話。

 全国の地方自治体の数は約1,800。
 47都道府県で平均すると、1県あたり約40市町村がある計算になる。

 仮に1つの自治体に、統一文字コードに含まれない1,000個の残存外字と1,000個の外国人専用外字が存在するとすると、
 1広域あたり、同定が必要な文字数は、

 40 × 2,000 = 80,000字

 仮に同定作業に費やせる期間を2ヶ月=50稼働日とすると、
 1日あたり処理が必要な数は、

 80,000 / 50 = 1,600字

 1日の稼働時間を10時間とすると、
 1時間あたり、

 1,600 / 10 = 160字

 1分あたり約3字、1字あたり約22秒。

 さて、どうしたものですかね。
 
  
 

はてなブックマークに追加 はてなブックマークのコメント livedoorクリップに追加 livedoorクリップ数 niftyクリップに追加  del.icio.usに追加  Yahoo!ブックマークに登録 Yahoo!ブックマーク数 googleに追加 

自由利用マーク
このマークは当blogの記事部分に付けられたものです。
タグリスト: 外字, 統一文字コード,

ナビゲーション

特集記事

カテゴリー

ブログ内検索

RECENT ENTRYS

RECENT COMMENTS

RECENT TRACKBACKS

プロフィール

現職公務員SE Author:現職公務員SE
 シスアドでセキュアドな後期高齢者医療制度SNS管理人。
 後期高齢者医療制度の資格事務担当だったはずがひょんなことで電算担当に。

HSタグクラウド

Feed Me!

公務員叩きに物申す!-現職公務員の妄言のRSSフィード

後期高齢者医療制度開始カウントダウン





リンク

中の人

FC2カウンター


公務員サイトランキング 現職公務員サイトランキング ビジネスブログランキング 人気ブログランキング - 公務員叩きに物申す!-現職公務員の妄言

スカウター : 公務員叩きに物申す!?現職公務員の妄言 はてなブックマークカウンター
  • seo

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。