名寄せとは?具体的なプロセスや顧客管理における重要性とおすすめツール4選
目次を閉じる
名寄せとは
「名寄せ」とはわかりやすく言えば複数のデータベースのなかから、個人名や住所、生年月日などの情報を手がかりに、同じ人物やIDなどをまとめる作業のことです。
たとえば同じ住所でも「1-2-3」「1-2-3」と全角・半角が違う、いわゆる表記ゆれだけで、システムは別の住所と判断して登録されることがあり、こういったデータを1つに統合します。
金融・相続における「名寄せ」の意味
金融・相続に関しても「名寄せ」という言葉が存在し、それぞれまったく違う意味があります。金融では、1つの銀行で複数の口座を持っている場合に、これを統合することを言います。
銀行が破綻した場合、預金者ごとに元本1,000万円までとその利息が保護されることから、預金者ごとの預金を合算するために口座を統合します。
また、相続の場合は支払うべき固定資産税を確認し、相続の登記を行うため、故人の所有する土地の情報をまとめた「名寄せ(名寄帳)」を市役所をはじめとする公共機関から取得します。
なお、今回紹介しているIT用語としての「名寄せ」は、金融の「名寄せ」がもととなっています。
名寄せの必要性
表記ゆれや昇進による肩書きの変更などが原因で、複数のデータベースに同じ人物、同じ企業、同じ顧客世帯などが分散して存在しているケースがあります。
そのままでは、データとして抽出した際に当然「ダブり」が出ます。これはたとえば同じ顧客に同一のDMを複数出す、複数の担当者が同じ人物に対して別々にアポを取るといったミスに発展しやすく、企業としての信頼を著しく低下させる危険性があるでしょう。
そういった事態を防ぐために、各々の顧客を識別するための個人名やメールアドレス、住所、生年月日などの属性が同じものに同一のIDを与えて統合する必要があります。
また、名寄せは本来別々に活用されていたデータベースを統合して運用しようとするケースでも必要です。
たとえば吸収合併された企業が使っていたデータベースを、吸収元の企業が活用しようとする場合です。それがもともとライバル関係にあった企業ならば、当然顧客データが重複している可能性が高くなるため、これをまとめてIDを振り直すために名寄せ作業が必要になります。
完全な名寄せは難しい?
このように、複数のデータベースを統合して新しく運用していくためには、全体的な名寄せの作業が必要です。
しかし顧客のなかには同姓同名の方もいるうえに、結婚や転勤などによって住所を変更する方もいます。そのため100%完全に名寄せを行うことは難しく、データベースの規模が大きくなればなるほど大変です。
しかし近年は、名寄せをするための専用ツールなども多く出回っており、徐々に効率的でスピーディな名寄せが可能になっています。
名寄せとデータクレンジングの違い
データクレンジングは、データベース内の文字を数値として変換したり、桁数や入力形式の違いを統一させたりすることをいいます。一方で、名寄せは統合したデータベースを整理し同じ人物や同じ属性のものを重複しないようにまとめる作業です。
つまり、名寄せのプロセスのひとつがデータクレンジング作業であり、名寄せ作業の中の一工程と捉えるといいでしょう。
名寄せのメリット
名寄せによりデータの精度が上がることで、マーケティング活動や営業活動が適切に行えます。
なぜなら担当者は、顧客に対して正しい知識(結婚による苗字変更や、昇進による肩書きの変更)を得られるため最適な対応が取れるからです。
これにより良好な関係を築きやすく、売上の向上にも期待できるでしょう。またマーケティング・営業アプローチの重複と、それによる信頼の低下を未然に防ぐことで、業務効率も向上します。
名寄せのやり方
それでは、名寄せの一般的なやり方について説明します。
(1)必要データの調査
まず統合するデータ内の各属性の入力状況を調べ、現状を把握します。それに応じて最終的な入力方針を決定し、どういった方向でデータをまとめていくのかを明確にします。
この調査の段階で、最終的にどういう方向でデータをまとめるのかを、しっかりと明らかにするのが重要です。
(2)データの抽出
名寄せの対象となるデータベースから、実際に整形が必要なデータの抽出を行います。
とくに複数のデータを統合する場合は、上述のように同じ属性のものに違ったIDが振られることが多いため一度不要なIDを破棄し、整形後に新しくIDを振り直します。
(3)データのクレンジング
抽出したデータを「クレンジング(クリーニング)」していく工程です。
データ内の各要素から重複や表記上の誤り、表記ゆれなどを探し、削除や修正などを行うことでデータの精度を向上させます。
具体的な例でいえば、一貫したルールのもとで全角と半角、空白や区切り記号などを統一します。
(4)データのマッチング
データの整形が終わったら、同じ種類・属性と識別された各々の要素に同一のIDを付与し、同一要素として特定できるようにします。
これによって、これまでデータベース内に存在していた要素の「ダブり」を排除して精度を上げ、運用に不具合が生じないよう調整します。
名寄せと表記ゆれ
次に、これまで簡単に紹介してきた「表記ゆれ」について詳しく説明します。データの精度を下げ、名寄せの作業を複雑にしているもっとも大きな要因が、この表記ゆれ問題といわれています。
表記ゆれとは?
表記ゆれとは、同じ意味を表す言葉に、漢字などの複数の表記が使われていることをいいます。つまり「同じことを表現しているのに、表記が違っている」という現象のことです。
たとえば、住所を「1丁目4番23号」と正しく表記しても、簡略化して「1-4-23」と住所欄に記載しても、郵便物は同じ場所に届きます。これ以外にも「1丁目4-23」と表記する方法もあるでしょう。データ入力の場合、半角・全角による表記の違いもあります。
そのほか顧客の姓が「髙木さん」か「高木さん」かなどが、典型的な表記ゆれの例でしょう。このような表記ゆれは、単純にデータベース内で文字の一致をすれば解決できる問題ではありません。
表記ゆれの例
表記ゆれの典型例としては、次のようなものが挙げられます。
(1)氏名
上述の「高木」と「髙木」をはじめ、「斉藤」と「齋藤」や「渡辺」と「渡邊」などが典型的な表記ゆれの例でしょう。
別々のデータベースに登録される際に、それぞれ違った字で登録されるケースは少なくありません。とくに顧客本人はどちらが正しいかは認識しているものの、会員登録をはじめとするデータ入力の際に、あえて簡単な字を使うケースもあります。
(2)住所
顧客データにおける表記ゆれがもっとも多いのは住所でしょう。上述の「1丁目1番1号」と「1-1-1」、「1-1-1」などの表記上の違いや、東京や名古屋、大阪に存在する「港区」のような例もあります。
住所は個人名以上に誤表記がとくに起こりやすく、変則的な表記方法も多いため、名寄せでは注意すべき項目です。
(3)社名
「株式会社ABC」と「株式会社エービーシー」のような表記上の違いもあります。
本来、法人名の表記は一意的に決まっているものです。しかし会社のスタッフであっても読みやすいように社名をカタカナで表記することもあり、そのままデータベースに登録し、後に表記ゆれを引き起こすことがあります。
人間的には同じ会社を意味することはすぐに理解できても、それがデータベースに登録されてコンピューター処理される場合、まったく違う顧客として認識されてしまう可能性があるのです。
名寄せと顧客管理
定期的にシステムの改善を行っている企業では、その都度データベースを企業全体で統合し、システムの改善後各部署に必要な部分を割り振るケースがあるでしょう。
あるいは社内の全スタッフが統一された総合顧客データベースに、常にアクセスできる場合も多いはずです。すると重複データがその都度発生し、各部署で整合性のある顧客アプローチができなくなります。
したがって、頻繁にシステムの改善やデータベースの統合・分散をする企業は、そのたびにしっかりと名寄せ作業をすることが重要です。
名寄せのためのツール4選
企業の顧客データベースを整理するために必要な「名寄せ」について一通り説明したところで、最後に名寄せ作業を簡略化・効率化してくれる便利なツールをいくつか紹介しましょう。
ユーソナー(uSonar) - ユーソナー株式会社
uSonarは、820万件※の法人企業データベースを搭載した顧客データ統合プラットフォームです。搭載する法人、企業データを営業リストや名寄せなどに利用できます。
年間2,000万※の企業データ項目をチェックし、社名変更や合併、倒産情報などを更新しています。搭載情報をもとに保有データの企業名や所在地の表記ゆれの補正から、無限階層での資本系列、本社、事業所関係の可視化まで対応可能です。
※uSonar公式サイトより(2022年11月24日閲覧)
Precisely Trillium
Precisely Trilliumは、世界で約2,000ユーザー※、日本においても約250ユーザー※の実績を誇るデータクレンジング・名寄せツールとして有名です。本記事で説明してきたようなデータ表記の不統一に関する問題を解決し、高度な辞書機能やマッチング機能により、顧客データのクレンジング・名寄せ・統合を行い、企業データの精度向上を実現してくれます。
※Precisely Trillium公式サイトより(2022年11月24日閲覧)
OpenRefine(Google Refine)
OpenRefine(Google Refine)は、Googleのチームが開発・リリースしたオープンソースの名寄せ・データクレンジングソフトウェアです。データ内にある余計な「ゴミ」を取り除き、クラスタリング機能を使って、複数の類似表記のデータを簡単に統一可能です。
モジュールはこちらのサイトからダウンロードできます。現在Windows、macOS、Linux向けにそれぞれ実行ファイルが配布されています。
DataStage®
DataStage®は、企業の扱う膨大で複雑なデータを統合し、スムーズな情報活用をサポートするためのETLツールです。
ETLツールとは、企業がデータウェアハウスを活用する際に基幹系をはじめとするシステムから、データを集める一連のデータ処理のことです。これを統合・効率化することによって、データベースの情報を生かしたスムーズな業務運営が可能になります。
DataStageは、これらのデータ処理をGUIで作成でき、データの処理拡張や修正にも迅速に対応できます。
名寄せの目的とプロセスを理解し、スムーズなデータ活用を実現しよう
名寄せの目的や具体的なプロセスについて解説しました。
いまや企業にとって顧客データベースは、もっとも重要な経営資産であることは間違いないでしょう。しかし、その貴重な情報に間違いや重複があった場合、健全な営業活動やマーケティングを行っていくことは難しくなります。場合によっては、クレームが発生する事態になるかもしれません。
名寄せやデータクレンジングは、クレームを回避し、スムーズな業務活動を実現するためには必要不可欠なプロセスといえます。人によってはデータベース内のちょっとした間違い程度の認識かもしれませんが、細かい部分のミスが大きな問題となるケースもあります。その重要性は、しっかりと意識する必要があるでしょう。
BOXILとは
BOXIL(ボクシル)は企業のDXを支援する法人向けプラットフォームです。SaaS比較サイト「BOXIL SaaS」、ビジネスメディア「BOXIL Magazine」、YouTubeチャンネル「BOXIL CHANNEL」を通じて、ビジネスに役立つ情報を発信しています。
BOXIL会員(無料)になると次の特典が受け取れます。
- BOXIL Magazineの会員限定記事が読み放題!
- 「SaaS業界レポート」や「選び方ガイド」がダウンロードできる!
- 約800種類のビジネステンプレートが自由に使える!
BOXIL SaaSでは、SaaSやクラウドサービスの口コミを募集しています。あなたの体験が、サービス品質向上や、これから導入検討する企業の参考情報として役立ちます。
BOXIL SaaSへ掲載しませんか?
- リード獲得に強い法人向けSaaS比較・検索サイトNo.1※
- リードの従量課金で、安定的に新規顧客との接点を提供
- 累計1,200社以上の掲載実績があり、初めての比較サイト掲載でも安心
※ 日本マーケティングリサーチ機構調べ、調査概要:2021年5月期 ブランドのWEB比較印象調査