名寄せとは | 具体的なプロセスや顧客管理における重要性とおすすめツール5選

企業が営業活動やマーケティング活動をする際に必要となるのが顧客データベースです。顧客に対してアプローチをかけるとき、氏名や住所、電話番号などをデータベースで検索しますが、その情報が間違っていた場合は当然、アプローチを誤ってしまいます。
これまで独立して活用していたデータベース同士を統合する場合には、要素の重複や誤表記が発生する可能性が高くなります。そういった問題を解決するための「名寄せ」について解説していきます。
目次を閉じる
名寄せとは
まず「名寄せ」とは何か、その概要から説明していきましょう。
名寄せとは何か
「名寄せ」とは、複数のデータベースのなかから、氏名や住所、電話番号などの情報を手がかりにして、同じ人物やIDなどをまとめる作業のことをいいます。
企業が扱うデータのなかには、複数のデータベースのなかに同じ人物、同じ企業、同じ顧客世帯などが分散して存在しているケースがあります。
そのままでは、データとして抽出した際に当然「ダブり」が出てくることになり、同じ顧客に同一のDMを複数出してしまうなどのミスが生じやすくなってしまいます。
そういった事態を防ぐために、各々の顧客を識別するための名前やメールアドレス、住所、電話番号などの属性が同じものに同一のIDを与えるなどして統合する必要があるわけです。
名寄せの必要性
名寄せが必要となるのは、多くの場合、本来別々に活用されていたデータベースを統合して運用しようとするケースです。
たとえば、吸収合併された企業が使っていたデータベースを吸収元の企業が活用しようとする場合、それがもともとライバル関係にあった企業ならば、当然、顧客データが重複している可能性が高くなります。
さらに両企業が別々の顧客IDを使って運用していると、それを最終的にまとめる作業が必要となってきます。つまり、名寄せを行い各々の顧客にIDを振りなおして整理する必要があります。
完全な名寄せは難しい?
このように、複数のデータベースを統合して新しく運用していくためには、全体的な名寄せの作業が必要になってきます。
しかし顧客のなかには、可能性は低いものの、同姓同名の方もいますし、結婚や転勤などによって住所を変更する方もいますから、100%完全に名寄せを行うことは難しく、データベースの規模が大きくなればなるほど大変になります。また、後に説明する「表記ゆれ」などの問題も生じてきます。
しかし近年は、名寄せをするための専用ツールなども多く出回っていますから、徐々に効率的でスピーディな名寄せが可能になってきています。 ツールについては後述します。
名寄せとデータクレンジング
名寄せの類語としてよく引き合いに出される用語にデータクレンジングがあります。両者を同じ意味で用いている方もおり、それはそれで間違いというわけではないのですが、厳密には違いがあります。
名寄せというのは統合したデータベースを整理するために、同じ人物や同じ属性のものを重複しないようにまとめる作業であり、データクレンジングは、データベース内の文字を数値として認識し直したり、桁数や入力形式の違いを統一させたりすることをいいます。
つまり、名寄せの一連のプロセスのうちのひとつが(データ)クレンジング作業ということですから、名寄せ作業のなかの一工程と捉えるといいでしょう。
名寄せのプロセス
それでは、名寄せの一般的なプロセスについて説明していきます。
(1)必要データの調査
まず統合するデータ内の各属性の入力状況を調べ、現状を把握します。
それに応じて最終的な入力方針を決定し、どういう方向でデータをまとめていくのかを明確にします。
この時点で、最終的にどういう方向でデータをまとめるのかが明らかになっていなくてはなりません。
(2)データの抽出
名寄せの対象となるデータベースから、実際に整形する必要のあるデータの抽出を行います。
特に複数のデータを統合する場合は、上述のように違った同じ属性のものに違ったIDが振られていることが多いですから、いったん不要なIDを破棄し、整形後に新しくIDを振り直すことになります。
(3)データのクレンジング
抽出したデータを「クレンジング(クリーニング)」していく工程です。
データ内の各要素から重複や表記上の誤り、表記ゆれなどを探し、それらの削除や修正などを行うことでデータの質を向上させていきます。
具体的な例でいえば、一貫したルールのもとで全角文字と半角文字、空白や区切り記号などを統一していきます。
(4)データのマッチング
データの整形が終わったら、同じ種類・属性と識別された各々の要素に同一のIDを付与し、同一要素として特定できるようにしていきます。
これによって、これまでデータベース内に存在していた要素の「ダブり」を排除し、運用に不具合が生じないようにするわけです。
名寄せと表記ゆれ
次に、名寄せをするうえで困難となる「表記ゆれ」について、ここで説明しておきましょう。名寄せの作業を複雑にしているもっとも大きな要因が、この表記ゆれ問題といわれています。
表記ゆれとは?
表記ゆれとは、同じ意味を表す言葉に、漢字などの複数の表記が使われていることをいいます。つまり「同じことを表現しているのに、表記が違っている」という現象のことです。
たとえば、住所などで「1丁目4番23号」と正しく表記しても、簡略化して「1-4-23」と住所欄に記載しても、郵便物は同じ場所に届くことになります。これ以外にも「1丁目4-23」という表記方法もあるでしょう。
あるいは顧客の姓が「髙木さん」なのか「高木さん」なのかという問題などが、典型的な表記ゆれの例でしょう。こういった表記ゆれは、単純にデータベース内で文字の一致をすれば解決できる問題ではありません。
表記ゆれの例
表記ゆれの典型例としては、以下のようなものが挙げられます。
(1)氏名
上述の「高木」と「髙木」をはじめ、「斉藤」と「齋藤」や「渡辺」と「渡邊」などが典型的な表記ゆれの例でしょう。
別々のデータベースに登録される際に、それぞれ違った字で登録されるケースは少なくありません。特に顧客本人はどちらが正しいかは認識しているものの、会員登録などをする際に、あえて簡単な字の方を使うケースもあります。
(2)住所
顧客データにおける表記ゆれがもっとも多いのは住所でしょう。上述の「1丁目1番1号」と「1-1-1」などの表記上の違いや、東京や名古屋、大阪に存在する「港区」のような例もあります。
住所は氏名以上に誤表記が特に起こりやすく、変則的な表記方法も多いため、名寄せでは特に注意すべき項目となっています。
(3)社名
「株式会社ABC」と「株式会社エービーシー」のような表記上の違いもあります。
本来、法人名の表記は一意的に決まっているものですが、その会社のスタッフであっても読みやすいように社名をカタカナで表記することもあり、それをそのままデータベースに登録してしまい、後に表記ゆれの問題を引き起こすことがあります。
人間的には同じ会社を意味することはすぐに理解できても、それがデータベースに登録されてコンピューター処理される場合、まったく違う顧客として認識されてしまう可能性があるわけです。
名寄せと顧客管理
顧客データベースを活用する際は、このような表記ゆれなどの問題をクリアした顧客データを利用しなければ、さまざまなミスや不具合を引き起こしてしまうことになります。
特に、営業やマーケティング業務で顧客データベースを活用しようとする場合は、事前の名寄せ作業は不可欠といえるでしょう。
使えないデータによるミスの可能性
もし営業活動に活用するためのデータが名寄せされていない統合データだった場合、同じ顧客でも違った表記による別の顧客データとして登録されている可能性があります。
そうなると、同じ顧客にまったく同じアプローチをしてひんしゅくをかってしまうかもしれません。
事実、同じ社名にアルファベット表記とカタカナ表記のものが同時に登録されていたために、部署内の営業スタッフがほとんど間をおかずに同じ相手に同じ営業アプローチをかけてしまい、相手先企業から怒られてしまうといったケースも多く発生しているようです。
システムの改善と重複データの発生
さらに、定期的にシステムの改善を行っている企業では、その都度各々の部署内のデータベースをいったん全社的に統合し、その後に各部署に必要な部分を割り振っていくケースがあるでしょう。
あるいは自社内の全スタッフが統一された総合顧客データベースに常にアクセスできる状態になっていることも多いはずです。
そうなると、重複データがその都度発生することになり、各部署で整合性のある顧客アプローチができなくなってしまうことになります。
したがって、頻繁にシステムの改善やデータベースの統合・分散をする企業は、そのたびにしっかりと名寄せ作業をする必要があります。
名寄せのためのツール5選
企業の顧客データベースを整理するために必要な「名寄せ」について一通り説明したところで、最後に名寄せ作業を簡略化・効率化してくれる便利なツールをいくつか紹介しておきましょう。
FORCAS
FORCASは、データ分析に基づいて有望な潜在顧客を発見し、戦略的なB2Bマーケティングを実現することを強力にサポートしてくれるツールです。いわゆるABM(アカウントベースドマーケティング)の実行をサポートし、詳細なデータ分析を根拠とした説得力のある顧客アプローチを実現してくれます。
また、マーケティングオートメーション(MA)やSFAとの連携により、より効率的なリードナーチャリングのサポートも可能になっています。
TRILLIUM(トリリアム)
TRILLIUMは、世界で約1,500ユーザー、日本においても約200ユーザーの実績を誇るデータクレンジング・名寄せツールとして有名です。本記事で説明してきたようなデータ表記の不統一に関する問題を解決し、高度な辞書機能やマッチング機能により、顧客データのクレンジング・名寄せ・統合を行い、企業データの質の向上を実現してくれます。
OpenRefine(Google Refine)
OpenRefineは、Googleのチームが開発・リリースしたオープンソースの名寄せ・データクレンジングソフトウェアです。データ内にある余計な「ゴミ」を取り除き、クラスタリング機能を使って、複数の類似表記のデータを簡単に統一していくことができます。
モジュールはこちらのサイトからダウンロードでき、現在、Windows、Mac OS、Linux向けにそれぞれ実行ファイルが配布されています。
Agra Vシリーズ
Agra Vシリーズは、社内外にバラバラに存在している、現状「使えないデータ」や「眠っているデータ」を仮想的に統合し、業務に使える「価値あるデータ」を生成してくれる仮想データ統合ソリューションです。
データクレンジング・名寄せに関する機能は「Agra VIQ」としてリリースされており、日本語の特性をしっかりと考慮した名寄せ・データクレンジング機能を提供してくれます。操作も簡単で、正常化変換、除去、置換などの各機能のボタンを選択するだけで簡単にクレンジングを実行できます。
DataStage®
DataStage®は、企業の扱う膨大で複雑なデータを統合し、スムーズな情報活用をサポートするためのETLツールです。
ETLツールとは企業がデータウェアハウスを活用する際に基幹系システムなどからデータを集める一連のデータ処理のことであり、これを統合・効率化することによってデータベースの情報を活かしたスムーズな業務運営が可能になります。
DataStageは、そういったデータ統合のための処理をGUIで作成でき、データの処理拡張や修正にも迅速に対応することができます。
名寄せの目的とプロセスを理解し、スムーズなデータ活用を実現する
名寄せの目的や具体的なプロセスについて解説してきました。
いまや企業にとって顧客データベースはもっとも重要な経営資産であることは間違いないでしょう。しかし、その貴重な情報に間違いや重複があった場合、健全な営業活動やマーケティングを行っていくことは難しくなります。場合によっては顧客からクレームをいただくような事態にもなるかもしれません。
名寄せやデータクレンジングは、そういった事態を避け、スムーズな業務活動を実現するためには必要不可欠なプロセスといえます。人によってはデータベース内のちょっとした間違い程度の認識かもしれませんが、細かい部分のミスが大きな問題となるケースもありますから、その重要性はしっかりと意識しておく必要があるでしょう。
ボクシルとは
ボクシルとは、「コスト削減」「売上向上」につながる法人向けクラウドサービスを中心に、さまざまなサービスを掲載する日本最大級の法人向けサービス口コミ・比較サイトです。
「何かサービスを導入したいけど、どんなサービスがあるのかわからない。」
「同じようなサービスがあり、どのサービスが優れているのかわからない。」
そんな悩みを解消するのがボクシルです。
マーケティングに問題を抱えている法人企業は、ボクシルを活用することで効率的に見込み顧客を獲得できます!また、リード獲得支援だけでなくタイアップ記事広告の作成などさまざまなニーズにお答えします。
ボクシルとボクシルマガジンの2軸を利用することで、掲載企業はリードジェネレーションやリードナーチャリングにおける手間を一挙に解消し、低コスト・高効率・最小限のリスクでリード獲得ができるようになります。ぜひご登録ください。
また、ボクシルでは掲載しているクラウドサービスの口コミを募集しています。使ったことのあるサービスの口コミを投稿することで、ITサービスの品質向上、利用者の導入判断基準の明確化につながります。ぜひ口コミを投稿してみてください。