Schrittweise Darstellung der Vorgehensweise bei der Auswertung eines Datensatzes im Vergleich zwischen Statistik und Maschinellem Lernen

 Statistik                                                                  Maschinelles Lernen

                                                        Frage beantworten: Was will der Anwender?

Unterteilung in Ziel- und Einflußgrößen                                                                   Lernziel und verwendetes Wissen erfragen
 

                                                                        Feedback des Anwenders

echte Redundanzen abfragen                                                                               Untersuchung auf funktionale Abhängigkeiten
                                                                                                                           (im Sinne der Datenbanktheorie) LINK!
 

ggf. Hauptkomponentenanalyse
und inverse Regression LINKS!
=> Projektion der Daten in
andere Räume
=> exisitieren funktionale
Abhängigkeiten (im mathematischen
Sinne)?
 

Frage nach der grundsätzlichen                                                                             Finden der Hypothesenklassen
Struktur der Daten                                                                                                Schlüsselattribute finden LINK!
                                                                                                                            => Was ist eine Beobachtung / Beispiel / Fall?
                                                                                                                            LINK!
 
                                                                                                                            Finden von geeigneten Repräsentationsformalismen
                                                                                                                            für die Daten, für die Hypothesen und für das
                                                                                                                            Hintergrundwissen
                                                                                                                            mögliche Repräsentationsformalismen
                                                                                                                            mit steigender Komplexität:
                                                                                                                            Aussagenlogik
                                                                                                                            Prädikatenlogik ohne Funktionssymbole
                                                                                                                            Prädikatenlogik mit Funktionssymbolen
 

                                                                                                                             Reduktion der Datenmenge durch Fokussieren
                                                                                                                             auf bestimmte Attribute und zufälliges oder geschichtetes
                                                                                                                             sampling bei den Beobachtungen
 
 
 
 

Zurück zur A4-Startseite