Googleスプレッドシートで重複データを検出して削除する方法

📅
🕑 1 分で読む

大量のデータを含む大きなスプレッドシートで作業していると、気づかないうちに重複したデータを追加してしまうことがよくあります。行が以前に追加されたかどうかを追跡するのは、特に数百、数千の行を扱う場合は面倒です。幸いなことに、Googleスプレッドシートには重複を見つけて削除する便利なツールが用意されており、時間を節約し、データ内の厄介な重複を回避できます。組み込み機能、アドオン、数式など、どれを使うにしても、これらの方法を使えば作業がはるかに楽になります。

Googleスプレッドシートで重複データを見つける方法

ただし、重複を削除ボタンを押しても、スプレッドシートでは何が削除されるのかは表示されません。クリーンアップのみが行われます。念のため確認したい場合は、まず重複をハイライト表示してください(これについては後ほど詳しく説明します)。設定によっては、Googleスプレッドシートの動作が少し遅くなったり、特にデータセットが大きい場合は不安定になったりすることがありますので、1、2分ほどかかっても驚かないでください。

シートを開いたら、チェックしたいデータ範囲を選択します。単一の列でも、データブロック全体でも構いません。次に、「データ」 > 「データクリーンアップ」 > 「重複を削除」を選択します。オプションを含む小さなウィンドウがポップアップ表示されます。

データにヘッダーがあるかどうかを必ず指定してください。ヘッダー行がデータとして扱われると、クリーンアップがうまくいかない可能性があるため、これは非常に重要です。すべての列が自動的に選択されているのが確認できますが、必要に応じてチェックを入れたり、選択を解除したりしてください。すべてが正しく表示されたら、緑色の「重複を削除」をクリックすると、小さなダイアログが表示され、削除された行数が表示されます。常に完璧とは限りませんが、通常は信頼できます。

アドオンを使用して、より大規模な重複データやより制御された重複データを削除する

データセットが複雑だったり、より柔軟な機能を求めているなど、組み込みツールが期待に応えられない場合は、専用のプラグインを追加するのが良いでしょう。プラグインを追加するには、「拡張機能」メニューをクリックし、「アドオン」>「アドオンを取得」を選択します。「重複を削除」などのキーワードを入力すると、いくつかのオプションが表示されます。

信頼できるものを選びましょう。例えば、Ablebitsの「Remove Duplicates」などの人気ツールがおすすめです。インストール時に権限を求められますが、Googleは必要以上に権限を要求してくるので、内容をよく確認してください。インストール後、スプレッドシートに戻り、「拡張機能」からアドオンを見つけて起動してください。

指示に従ってください。これらのツールのほとんどは、範囲、完全一致のチェックの有無、データにヘッダーがあるかどうかを指定できます。盲目的に削除するのが不安な場合は、重複を最初に強調表示するように選択することもできます。準備ができたら実行ボタンを押して、何が見つかるかを確認してください。結果には、強調表示または削除された重複の数が表示されます。このような制御ができるのは便利です。

数式を使用して重複を検出して削除する

数式に慣れている方なら、データに重複データが紛れ込むのを防ぐ便利な方法があります。UNIQUE関数がおすすめです。基本的に、この関数は選択範囲から重複しないデータだけをリスト化します。

例えば、空白のセルに と入力し、 rangeを実際のデータ範囲( など)に=UNIQUE(range)置き換えます。これにより、重複のない新しいリストが生成されます。データセットのクリーンアップ版を作成したい場合に最適です。必要に応じて、元のデータをコピーして置き換えることができます。=UNIQUE(A2:A100)

便利な方法の一つは、数式を列間または行間でドラッグして重複する可能性のあるデータをすべて確認することです。ただし、データに微妙な違いがある場合は、必ずしも完璧とは限りません。より正確に表示するには、他の関数やフィルターと組み合わせる必要があるかもしれません。それでも、あまり手間をかけずに何が何だかを確認したいときには、非常に便利です。

まとめ

重複データを削除するのは、面倒な作業ではありません。Googleスプレッドシートに組み込まれたクリーンアップツール、便利なアドオン、あるいはシンプルな数式を使うなど、これらの方法を使えば、手作業で何時間もかかる編集作業を省くことができます。もしある方法がうまくいかなかったり、リスクが大きすぎると感じたら、別の方法を試してみてください。データセットのサイズや構造によっては、結果が異なる場合があります。重要なのは、これで、手間をかけずにスプレッドシートを整理整頓できるオプションが手に入ったということです。

まとめ

  • Google スプレッドシートには重複を削除する機能が組み込まれていますが、少し強引なため、削除される内容をプレビューできません。
  • アドオンを使用すると、より詳細な制御が可能になり、より大規模なシートや複雑なシートに最適です。
  • のような数式を=UNIQUE()使用すると、元のデータをそのまま維持しながら、重複のないよりきれいなリストを作成できます。

これが役に立つことを祈る