本人ではない銀行口座13万件。別人の保険証情報7300件。トラブルの内容・件数とも問題があるマイナンバー。担当大臣はテレビ番組で、以下の原因を挙げる。
「フリガナ情報がないので銀行口座と紐付けられない」 「住所表記に『ー』と『の』が混じってる」 「半角と全角が混じってる」
懐かしい。同じような問題に対処したことがある。「30年」ほど前だ。
合併で混沌当時、勤めていた会社が、関連会社10社と統合・合併することになった。法律面など外面は整えたものの、社内は混沌。1300人を超える従業員の「従業員コード」すら整理されてない有様だ。マイナンバーとは規模こそ違うが、問題は酷似していたのではあるまいか。
そんな中、決算日が迫る。合併以降初めての決算だ。
「早く、大きくなった売上高や利益額が見たい」
経営陣からの「圧」が日に日に強まる。
「00750」氏と「0750」氏は別人一方、決算作業は遅々として進まない。各社(旧関連会社)のデータフォーマットがバラバラだからだ。
例えば、従業員コードである。A社(旧関連会社)の従業員コードは、先頭にゼロが付く。「00750」氏と、「0750」氏は別人だ。一方、B社には「750」氏がいる。数値化すると、この3人はみな「750」氏。同一人物になってしまう。とりあえず、従業員コードに「100000」を足した暫定従業員コードを作って凌ぐ。
「名前」で紐付けせざるを得ないという――マイナンバーとよく似た――作業もあった。片方は漢字氏名。もう片方は、カナ氏名。紐付けする共通の「項目」がない。手入力は時間がかかるし、ミスも出る。どうするか。旧関連会社の部門長に相談したら、あっさり片付いた。
「ウチに漢字とフリガナの一覧表があるよ」
年賀状(そういう時代だ)用の、各部員の漢字氏名・カナ氏名・住所等をまとめたエクセルの表がある、とのこと。他部門にも配布していたので、ほぼ全員をカバーしている。これを使わせてもらうことにした。
いただいた「漢字・フリガナ変換表」をデータベースにインポート。各データを、これを介して紐付け……紐付かない? データの中味を見てみると……
「ショウジ」さんと「シヨウジ」さん。「柳下」(ヤギシタ)さんと「栁下」さん(旧字 卯の左辺が「夕」)。同じ人なのに字が違う。他にも「ャュョ」(小文字)やら、全角半角混在やら、不統一・入力誤りがちらほら。関数と一括置換で整え、ようやく紐付く。
他の作業も、エクセルやテキストエディタ、発売されたばかりのデータベースソフトを酷使し、なんとか決算日までに作業を終えた。
比較的早く終わった要因は二つ。一つは、他者のデータを活用したこと。すでにテキストファイル化されたデータが、大抵どこかにあるので、これを最大限活用した。
もう一つは、全てをプログラムでやろうと考えなかったこと。プログラマーに「表記ゆれ」について相談したところ「正規表現を使って……」と悩み始めた。かなり手間がかかるらしい。チェックプログラムのように何回も使うものではない。既に手元にあるデータの修正だ。一回やれば事足りるので、多少の手作業は厭わないことにした。
手作業するときは、極力、関数や置換、コピー&ペーストを使ってミスを防ぐ。「入力」は最後の手段と位置づける。こういった方針も奏功したようだ。