Was ist Data Mining und ist es illegal?
Nächste Artikel-ID: 724493
Data Mining als Konzept wird immer beliebter, aber nicht viele wissen, wofür es steht. Viele Online-Unternehmen sprechen darüber, wie sie Data Mining einsetzen, um die Qualität ihrer Dienste zu verbessern.
Aber was ist Data Mining? Ist es überhaupt legal?
Was ist Data Mining und wie funktioniert es?
Data Mining ist ein Prozess, mit dem Unternehmen und Datenwissenschaftler Informationen extrahieren und Trends in Rohdaten finden. Die im Mining verwendeten Daten können aus verschiedenen Quellen stammen, z. B. aus Online-Umfragen, über Cookies gesammelten Daten oder öffentlichen Aufzeichnungen.
Aber nicht alle Datensätze sind gleichermaßen vorteilhaft. Die Daten müssen genau und ohne Verzerrung sein, möglichst wenig Lücken aufweisen und ein großes Volumen aufweisen, um authentische Ergebnisse zu erzielen.
Da Sie mit Rohdaten anstelle von vorgefertigten Statistiken arbeiten, kann Data Mining ein vielseitiges Werkzeug sein. Sie können denselben Datensatz mehrmals auf unterschiedliche Weise verarbeiten und nach verschiedenen Trends suchen. Dadurch sind die Erkenntnisse aus einem einzigen Datensatz praktisch unbegrenzt.
Es gibt keine eindeutige Data Mining-Technik, da das Extrahieren der zugrunde liegenden Trends viel Kreativität und Geschick erfordert. Der Prozess kann jedoch in fünf Hauptschritte unterteilt werden.
1. Beschaffung der Daten
Der erste Schritt besteht darin, eine Quelle für Ihre Daten zu finden und auf einen Speicherserver zu importieren. Hier sind erste Eindrücke und Datenquellen am wichtigsten. Sie müssen Ihre Datenquelle glaubwürdig sein, um sicherzustellen, dass Ihre Ergebnisse vertrauenswürdig sind.
2. Arbeitsumgebung auswählen
Unabhängig davon, ob Sie lokal an Ihrem Gerät arbeiten oder eine Cloud-basierte Umgebung verwenden , ist es jetzt an der Zeit, diese zu übertragen. Die Umgebung Ihrer Wahl muss leistungsfähig genug sein, um die Datenmenge zu verarbeiten, die Sie verarbeiten möchten. Wenn Sie mit einem Team arbeiten, hat die Barrierefreiheit Priorität. Daher sind Cloud-basierte Umgebungen die beste Option.
3. Datensegmentierung und Kategorisierung
Unabhängig davon, ob die Daten, an denen Sie arbeiten, mit Tags versehen sind oder nicht, müssen Sie sie in Kategorien einteilen, die sich auf die Art der Informationen oder Muster beziehen, die Sie extrahieren möchten, bevor Sie mit der Verarbeitung beginnen. Abhängig von der Datengröße müssen Sie möglicherweise in Abschnitten anstatt als Ganzes daran arbeiten.
4. Data Mining
Nachdem Sie die Daten vorbereitet und festgelegt haben, was Sie damit tun möchten, wird der eigentliche Prozess des Mining und Extrahierens von Informationen ausgeführt. Sie können für diesen Schritt spezielle Software verwenden oder unabhängig mit einer kompatiblen Programmiersprache wie R, Python oder SQL arbeiten.
Data Mining verwendet mathematische Modelle, um Erkenntnisse auf Basisebene für Rohdaten zu finden und zu extrahieren. Sie sollten es jedoch nicht mit einer Datenanalyse verwechseln, bei der die häufig durch Data Mining gewonnenen Daten und Erkenntnisse zur Erstellung von Modellen und Vorhersagen verwendet werden.
5. Übersetzen der Ergebnisse
Allein die Bergbauergebnisse können schwer zu verstehen sein. Der letzte Schritt besteht darin, die Daten zu visualisieren, indem sie in Grafiken oder Tabellen übersetzt werden. Die visualisierten Ergebnisse sind zwar für zukünftige Analysen und Bergbauarbeiten nicht von großem Nutzen, erleichtern jedoch das Verständnis und den Austausch Ihrer Ergebnisse.
Wofür wird Data Mining verwendet?
Sie können Data Mining verwenden, um Informationen zu allen Informationen zu erhalten, zu denen Sie Rohdaten haben. Große Unternehmen und Online-Websites verwenden es jedoch häufig, um ihre Daten abzubauen und nach Vorhersagen und Verhaltensanalysen zu suchen.
Unternehmen, die im Einzelhandel oder im E-Commerce tätig sind, erfassen Daten von Benutzerkonten, indem sie Umfragen durchführen oder Kunden- und Benutzeraktivitäten auf ihrer Website oder App protokollieren. Sie können dann die Daten abrufen, um nach Trends bei den Einkäufen zu suchen, von der Tages- und Wochenzeit bis zur Häufigkeit der Besuche und den damit verbundenen Ausgaben.
Tatsächlich ermöglicht Data Mining den Geschäften, Benachrichtigungen und Rabattgutscheine zu Zeiten zu senden, in denen sie mit größerer Wahrscheinlichkeit kaufen. Dies würde nicht nur zu höheren Einnahmen führen, sondern auch zu einem effektiveren und kostengünstigeren Marketing.
Aber nicht nur Unternehmen nutzen Data Mining. Sie können den direkten Einfluss von Data Mining in der Kriminalitätsanalyse feststellen, sodass Regierungen bestimmen können, in welchen Gebieten und zu welchen Tageszeiten die Kriminalitätsraten höher sind.
Data Mining spielt auch bei der Wettervorhersage eine Rolle. Es hilft Meteorologen dabei, riesige Mengen von Wetterdaten zu analysieren, die über einen bestimmten Zeitraum über das Klima als Ganzes oder einen bestimmten Ort gesammelt wurden.
Ist Data Mining illegal?
Data Mining ist an sich nicht illegal. Das Problem ergibt sich aus der Datenquelle und dem, was Bergleute mit den Ergebnissen machen.
Die Daten müssen entweder öffentlich bekannt sein, z. B. Wetterdaten, oder einvernehmlich abgerufen werden. Das bedeutet, dass Benutzer von Websites und Apps sowie Teilnehmer an Online- und physischen Umfragen darauf aufmerksam gemacht werden müssen, dass das Unternehmen ihre Antworten und Informationen für Analysen und Mining aufbewahrt.
Unternehmen und Institutionen, die keine Berechtigung zur Verwendung von Daten haben, können je nach Datenquelle sowohl lokal als auch offshore gegen Datenschutzgesetze verstoßen. Ganz zu schweigen davon, dass die meisten Länder die Verwendung von Data-Mining-Erkenntnissen verbieten, um Personen aufgrund ihres Alters, Geschlechts, Geschlechts, ihrer Rasse oder ihrer Religion zu diskriminieren.
Wie fange ich mit Data Mining an?
Nachdem Sie nun wissen, was Data Mining ist und wie es legal ist, könnten Sie daran interessiert sein, es selbst auszuprobieren.
Data Mining ist nicht auf große Unternehmen mit Tonnen von Ressourcen und Rechenleistung beschränkt. Solange Sie ein Studienfach haben, das Sie kennenlernen möchten, und den legalen Zugriff auf Datensätze, können Sie mit dem Mining nach Informationen beginnen.
Der erste Schritt ist das ethische Abrufen von Daten. Zum Glück müssen Sie es nicht kaufen oder eine Online-Umfrage erstellen. Es gibt mehrere öffentliche Datensätze zu verschiedenen Themen, die Sie kostenlos analysieren können.
- Data.gov
- Erddaten
- Pew Research Center
- Nationales Klimadatenzentrum
- Daten des Global Health Observatory
Bei der Software können Sie aus einer Vielzahl kostenloser Data Mining-Tools auswählen. Zum einen gibt es Orange , eine Python-Data-Mining-Software, die für Anfänger geeignet ist. Wenn Sie jedoch nach Software suchen, mit der erweiterte Mining-Algorithmen ausgeführt werden können, können Sie das Open-Source-Data-Mining-Tool R verwenden .
Wenn Sie am Mining interessiert sind, sich aber nicht sicher sind, was Sie brauchen, können Sie zunächst die Grundlagen der Datenanalyse und -manipulation erlernen .
Die Zukunft des Data Mining
Da sich das Zeitalter von Daten und Informationen noch in einem frühen Stadium befindet, wird Data Mining immer beliebter. Während ethische Bedenken immer noch ein Thema sein könnten, kann Data Mining in den richtigen Händen eine Kraft für Gut und Wissen sein, anstatt für Böses und Unheil.