# Stochastik fuer Lehramt II, SS 08 ########### # Blatt 4 # ########### #Aufgabe 2 #a # Math<-read.table("MyPath/Math.txt",header=T,sep="\t", quote="") attach(Math) summary(Math) # †berblick # 351 FŠlle, 8 Variablen # Geburtsjahr: Ist Jahr geboren # Studienrichtung: math: Diplom-Mathematik; wima: Diplom-Wirtschaftsmathematik # Anfang: Studienanfangsjahr # VorDauer: Dauer des Vordiploms (heute: Grundstudium); in Jahren # HauptDauer: Dauer Hauptdiplom (heute: Hauptstudium); in Jahren # VDnote: Vordiplomsnote; 1-4 # Dnote: Diplomsnote; 1-4 # HDnote: Hauptdiplomsnote; 1-4 # einzig kategorielle: Studienrichtung #Dnote steht fźr Note der Diplomarbeit # Sinn wegen Werten: Zwei Begutachter einer Diplomarbeit und Durchschnitt # Boxplot Dauern gegen Studienrichtung; Histogramme etc. fźr †berblick des Datensatzes #b #Histogramm # Gesamtdauer Mathematiker hist(VorDauer[Studienrichtung == "math"] + HauptDauer[Studienrichtung == "math"], xlab = "Studiendauer", main = "Studiendauer eines Mathematikers", breaks = 12, col = "grey") # Gesamtdauer Wirtschaftsmathematiker hist(VorDauer[Studienrichtung == "wima"] + HauptDauer[Studienrichtung == "wima"], xlab = "Studiendauer", main = "Studiendauer eines Wirtschaftsmathematikers", breaks = 12, col = "grey") # Interpretation Histogramme: Unterschied in den SchwŠnzen: Ausreisser nach oben # bei Wirtschaftsmathemtikern; bei Mathematikern oben und unten Ausreisser # (groesser gestreut); insgesamt hoeher fuer Mathematiker (ca. 1 Semester) #Streudiagramm plot(VorDauer[Studienrichtung == "math"] + HauptDauer[Studienrichtung == "math"], rep(0.1,153), pch = 20, xlab = "Studiendauer", ylim = c(-0.2,0.2)) points(VorDauer[Studienrichtung == "wima"] + HauptDauer[Studienrichtung == "wima"], rep (-0.1,198), col = "magenta", pch =20) # Legende haette reingepasst! # Interpretation: Fuer Mathematiker streut es staerker # 1.34 (Ma) und 1.13 (WiMA) als Streuung # Drei richtig starke streuen bei WiMa, nach rechts #Boxplot boxplot(VorDauer[Studienrichtung == "math"] + HauptDauer[Studienrichtung == "math"], VorDauer[Studienrichtung == "wima"] + HauptDauer[Studienrichtung == "wima"]) # Man sieht sehr gut Ausreisser, Streuung, Median in beiden Gruppen # Streuung von Mathematikern groesser; beide nach oben Ausreisser, gleich viele #Schaetzen # Erwartungswerte schŠtzen mu_m<-mean(VorDauer[Studienrichtung == "math"] + HauptDauer[Studienrichtung == "math"]) mu_w<-mean(VorDauer[Studienrichtung == "wima"] + HauptDauer[Studienrichtung == "wima"]) # Standardabweichungen schŠtzen sigma_m<-sd(VorDauer[Studienrichtung == "math"] + HauptDauer[Studienrichtung == "math"]) sigma_w<-sd(VorDauer[Studienrichtung == "wima"] + HauptDauer[Studienrichtung == "wima"]) # Fuer laenger als drei Jahre 1-pnorm(3, mean=mu_m, sd=sigma_m) 1-pnorm(3, mean=mu_w, sd=sigma_w) # kaum Unterschied, nahezu 99.5% fuer beide (es gibt keine mit weniger drei Jahren # Studiendauer); Normalverteilung hier passt gut mit der Interpretation # Falsche Aufgabenstellung im Text (fuer 6 Jahre) 1-pnorm(6, mean=mu_m, sd=sigma_m) 1-pnorm(6, mean=mu_w, sd=sigma_w) # Ma: Ca. 65% # WiMa: 50% # Ma studieren lŠnger (W! groesser fuer groesser 6) # Manche Studiendauern sind recht kurz: Bei Ma und Wima # Studiengang gewechselt mit Nachweisen spart Zeit im neuen Studium # Studiensemester (gesamt ueber alle Studien) gegen Fachsemester # (in spezifischem Fach) #c plot(VDnote, HDnote, pch = 20) (diff<-VDnote-HDnote) # Verbessern heisst positiv # Verschlechtern heisst negativ # zum finden der Schranke anschauen; finden drei am meisten verbessert, # zwei am meisten verschlechtert # Willkuerliche Schranke 1.5 fuer "am meisten verbessert" points(VDnote[diff > 1.5], HDnote[diff > 1.5], pch = 19, col = "green") # rechts unten im Scatterplot # Willkuerliche Schranke -1 fuer "am meisten verschlechtert" points(VDnote[diff < -1], HDnote[diff < -1], pch = 19, col = "magenta") # links oben im Scatterplot # Wo liegen, global, die die sich verbessern bzw. verschlechtern im Streudiagramm? abline(0,1) # y-Achsenabschnitt a=0, Steigung b=1 # ueber Winkelhalbierende: verschlechtert # unter Winkelhalbierende: verbessert # mehr verbessert, als verschlechtert (mehr drunter als drueber)