Der Begriff „Big Data“ umfasst zwei große Bereiche. Einerseits bezieht er sich auf die Anhäufung riesiger und ziemlich unübersichtlicher Datenmengen, die so groß und komplex sind, dass herkömmliche Datenverarbeitungssoftware nicht mehr ausreicht, um sie zu verarbeiten. Dazu gehören zum Beispiel viele unstrukturierte Daten aus sozialen Netzwerken, aber auch strukturierte Daten wie Webserver-Protokolle und Internet-Klickströme. Zu „Big Data“ gehören aber auch die dazugehörigen Systeme, die diese Daten überhaupt erst analysieren und auch auswerten können.
Bei der Big-Data-Analyse werden meist große Datensätze untersucht, um Muster, Trends und Korrelationen zu erkennen. Diese Analysen können zur Verbesserung der Entscheidungsfindung, zur Optimierung von Marketingkampagnen und zur Vorhersage künftiger Ereignisse eingesetzt werden. Big Data stellt für Unternehmen eine Herausforderung dar, da sie mehr Speicherplatz, Verarbeitungsleistung und Bandbreite erfordern als herkömmliche Datensätze. Big-Data-Analysen erfordern daher immer auch eine rechen- und datenintensive Datenverarbeitung.