Excelでのデータクレンジング:効率的な方法と便利な関数

データ分析や業務処理を行ううえで、正確で整理されたデータは不可欠です。
しかし、実際に扱うデータは「余分なスペース」「文字コードの混在」「日付フォーマットの不一致」など、統一されていないケースが多くあります。
こうした整理・修正作業は「データクレンジング」と呼ばれ、Excelでも簡単に行うことができます。
本記事では、Excelの標準機能や関数を活用した効率的な方法を解説します。業務の精度と効率を高めるための第一歩として、ぜひ参考にしてください。
データクレンジングとは

データクレンジングとは、誤り・不備・不要な情報を取り除き、データを正しく整える作業を指します。
代表的な処理例は以下の通りです。
- 余分な空白の除去
- 不要な記号や文字の削除
- 日付や数値フォーマットの統一
- 全角・半角の統一
- 名寄せ(同一人物や企業を同じ名称に統一)
Excelを使えば、これらの処理を効率的に実施できます。
データクレンジングの目的

どんなに高度な分析を行っても、元データに誤りや不整合が含まれていては正しい結果は得られません。
データクレンジングを行う主な目的は次の通りです。
集計や分析の精度向上 | 誤ったデータが混じると、結果が大きく歪む |
検索やフィルタの精度向上 | 表記ゆれで検索漏れが発生する (例:「田中 太郎」と「田中太郎」) |
データ統合の効率化 (名寄せ) | 名寄せによって複数データベースの統合がスムーズになる |
エクセルの標準機能を使う

「データクレンジング」と聞くと特別なツールや複雑な関数が必要と思われがちですが、実際はExcel標準機能だけでも十分に対応可能です。
特に「検索と置換」や「スペース削除」といった基本機能は、シンプルながら強力です。
Excelの置換機能で代用
「Ctrl + H」で表示される検索と置換機能は、データクレンジングの基本です。例えば、
- 全角スペース「 」を半角スペース「 」に置換
- 特定の記号(例:ハイフン「-」やカッコ)を削除
などの作業が一括で行えます。
ここで、全角スペース「 」を半角スペース「 」に置換する方法について解説します。
氏名の間にある「全角スペース」を「半角スペース」に変更します。

1.「Ctrl + H」で検索と置換を開く
2.「検索する文字列」に全角スペースを入力

3.「置換後の文字列」に半角スペースを入力
4.「半角全角を区別する」にチェックを入れる
5.「すべて置換」をクリック

これで、氏名や住所などに含まれる余分な全角スペースを一括で修正できます。

不要なスペースの削除
空白スペースは、検索や一致判定の妨げになる代表的な要因です。見た目では分からなくても、セルの先頭や末尾に半角スペースが入っているケースはよくあります。こうした余分なスペースは、集計や検索の精度を落とすため、早めに削除しておきましょう。
もっとも簡単な方法は、検索と置換機能を使う方法です。
1.「Ctrl + H」で検索と置換を開く
2.「検索する文字列」に削除したい空白(例:全角スペース)を入力
3.「置換後の文字列」は空欄のままにする
4.「すべて置換」をクリック

これで氏名の間にあった全角スペースを一括削除できます。

エクセルの関数を使う

Excelには、データ整理に便利な関数が多数用意されています。ここでは代表的なものを紹介します。
TRIM関数
文字列の先頭・末尾・途中にある余分な半角スペースを削除します。
※全角スペースは対象外なので注意が必要です。
=TRIM(文字列) |

CLEAN関数
文字列中に含まれる制御文字や不要な改行コードを削除します。
=CLEAN(文字列) |

DATEDIF関数
日付の差分を求める関数です。データにバラつきがある場合、日付形式を統一してから使用すると便利です。
=DATEDIF(開始日, 終了日, 単位) |
- 単位 “D”:日数
- 単位 “M”:月数
- 単位 “Y”:年数

ASC関数(JIS関数)
全角文字を半角文字に変換する関数です。電話番号や数値を統一する際に役立ちます。
=ASC(文字列) |

LEFT / RIGHT / MID関数
文字列の一部を抜き出して修正するのに便利です。
LEFT:左から指定文字数を取得
=LEFT(文字列, 文字数) |

RIGHT:右から指定文字数を取得
=RIGHT(文字列, 文字数) |

MID:任意の位置から指定文字数を取得
=MID(文字列, 開始位置, 文字数) |

エクセルでデータクレンジングを行う際のポイント

Excelを使ってデータクレンジングをスムーズかつ正確に進めるためには、いくつかの基本的な注意点を押さえておくことが大切です。ここでは、作業効率を高めつつミスを防ぐためのポイントをまとめました。
必ず元データを残す(バックアップ)
データを直接編集してしまうと、誤って削除した情報を元に戻せなくなるリスクがあります。作業前に元データを別シートにコピーする、別ファイルとして保存するといった工夫で、いつでも見直せる状態を確保しましょう。
1ステップずつ処理する
複数の修正を一度に行うと、どこでエラーが発生したのか特定しづらくなります。
「スペース削除 → 文字変換 → データ抽出」といった処理は、手順を分けて確認しながら進めることが重要です。
関数と置換を組み合わせる
関数だけ、または置換機能だけでは対応しきれないケースもあります。
例えば:
- TRIM関数で不要なスペースを削除
- ASC関数で全角英数字を半角に変換
- LEFT関数で必要な文字列を切り出し
このように関数を組み合わせると、より精度の高いクレンジングが可能になります。
また、置換で記号を削除してから、関数で整形するといった流れも効果的です。
名寄せは人間の目での確認も重要
関数やツールを使っても、自動で完全一致を判断できないケースがあります。
例:
- 「(株)山田商事」
- 「山田商事株式会社」
意味としては同じですが、文字列は異なります。
このような表記ゆれは、最終的に人の目で確認して判断することが欠かせません。
まとめ
Excelを使えば、特別なツールがなくても誰でも手軽にデータクレンジングを行えます。
- 検索と置換といった標準機能
- TRIM、CLEAN、DATEDIF、ASC、LEFT、RIGHT、MIDといった便利な関数
これらを組み合わせれば、柔軟かつ効率的にデータを整えられます。
クレンジングは地道な作業ですが、最終的にはデータの信頼性を高め、分析・レポート作成・意思決定のスピードと正確さに直結します。さらに、精度の高いデータは名寄せや外部とのデータ連携もスムーズにします。まずは、身近なデータにある「空白」や「表記ゆれ」を整えるところから始めましょう。
日々の小さな積み重ねが、大きな業務改善につながります。