Office Forum
www.Office-Loesung.de
Access :: Excel :: Outlook :: PowerPoint :: Word :: Office :: Wieder Online ---> provisorisches Office Forum <-
Aufgabenblatt1
Gehe zu Seite Zurück  1, 2
zurück: AB2 - Aufgabe 1 weiter: AB2 - Aufgabe 2 Unbeantwortete Beiträge anzeigen
Neues Thema eröffnen   Neue Antwort erstellen     Status: Antwort Facebook-Likes Diese Seite Freunden empfehlen
Zu Browser-Favoriten hinzufügen
Autor Nachricht
E4M
Excel-Moderator


Verfasst am:
08. Feb 2007, 23:23
Rufname:

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo zusammen,


Bitte lasst mal das Wiki-Beispiel beiseite!


ich möchte noch einmal unser Beispiel aufgreifen:

ABCD
1ixi(xi - xquer)(xi - xquer)^2
218
3212
4313
5410
658
7611
877
9810
10912
11109
12 Summe:
13
14n = 10
15summe xi = 100
16Mittelwert xquer = 1010
Formeln der Tabelle
B14 : =ANZAHL(A2:A11)
B15 : =SUMME(B2:B11)
B16 : =B15/B14
C16 : =MITTELWERT(B2:B11)

n ist die Anzahl der Beobachtungen ("Anzahl Mitglieder")
X ist das Merkmal ("Anzahl der bestellten Getränke")
xi ist die i-te Merkmalsausprägung ("Mitglied i bestellt xi Getränke")
summe xi ist die Merkmalssumme ("alle Mitglieder zusammen haben summe xi Getränke bestellt" mit i = 1,2,...,n)
xquer ist der Mittelwert = summe xi / n

Soweit OK?

Die Varianz soll definiert sein laut dem Übersichtsblatt1 mit
s^2 = 1/n * summe (xi - xquer)^2

1. Schritt: wir bilden die Differenz zwischen einem jeden xi und dem
Mittelwert xquer (für i =1,2,...,n) (Abweichungen) in Spalte C. Wenn wir
nun die Summe aus diesen Abweichungen bilden, ergibt diese null. Dies ist eine
wichtige Eigenschaft des arithmetischen Mittels (Mittelwert; Durchschnitt):
Die Abweichungen der Daten vom arithmetischen Mittel xquer heben sich
gegenseitig auf. Deshalb nennt man xquer auch den Schwerpunkt der Daten.

2. Schritt: Die Varianz ist ein Streuungsmaß (ein
solches beschreibt wie weit die Daten voneinander oder - wie bei der
Varianz - von einem bestimmten Wert (z.B. Mittelwert) entfernt liegen).
In Spalte C haben wir gesehen, dass wir nicht weiterkommen ein solches
Maß zu definieren, wenn wir lediglich die Abweichungen (xi - xquer) bilden,
da die Summe immer null ist. Ein großer Trick ist nun nicht (xi - xquer) zu
rechnen, sondern die quadratischen Abweichungen (xi - xquer)^2 wie in
Spalte D.

Es gibt natürlich weitere Möglichkeiten Streuungsmaße zu definieren,
z.B. mittels absoluter Abweichungen, wir beschränken uns aber auf die
Varianz und die Standardabweichung.


Da der Ausdruck (xi - xquer )^2 für alle i größer gleich null ist sowie
n>0 ist, gilt für die Varianz s^2>=0. s^2=0 gilt genau dann, wenn alle xi
gleich sind, also x1=x2=x3=...=xn. Daraus folgt auch, dass xquer =
x1=x2=...=xn ist und somit die quadrierten Abweichungen null sind
sowie schließlich s^2 = 0 / n = 0.
Eine weitere Eigenschaft der Varianz ist, dass sie dem Merkmal
zugrundeliegende "Einheit zum Quadrat" besitzt, d.h. werden "verkaufte
Erdbeeren pro kg" betrachtet, haben alle xi und auch xquer die Einheit kg,
dagegen die Varianz die Einheit kg^2. Daher wir auch meist die Standard-
abweichung berechnet, welche sich aus der (positiven) Wurzel der Varianz
ergibt: s = wurzel(s^2) =s^2*0,5 = s. s hat somit wieder dieselbe Einheit
wie die xi und xquer: kg.

Grüße

Andy

P.S.: Bitte lasst mal das Wiki-Beispiel beiseite!


Zuletzt bearbeitet von E4M am 08. Feb 2007, 23:56, insgesamt einmal bearbeitet
ae
Mein Name ist Ente


Verfasst am:
08. Feb 2007, 23:52
Rufname: Andreas
Wohnort: Reppenstedt bei Lüneburg


AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo Andy,
danke daß Du dir nochmals die Mühe machst -

Zitat:
Die Varianz soll definiert sein laut dem Übersichtsblatt1 mit
s^2 = 1/n * summe (xi - xquer)^2


Verstehe ich das richtig, daß Varianz etwas definiertes ist ? (Mit mehreren Definitionsmöglichkeiten)

Was mir dann immer noch nicht klar ist, was bitte ist nun der Sinn bzw. Unterschied zwischen Varianz und Standardabweichung?

Wenn ich das Tanzschulen- und Ofenbaubeispiel von Tom bzw. Wikipedia betrachte, ist doch die Standardabweichung einfach etwas, was von der Norm bzw. dem Mittelwert (Durchschnitt) abweicht.
Das leuchtet mir auch ein - da kann ich mir etwas drunter vorstellen.

Um es für mich auf den Punkt zu bringen

Die Standardabweichung sind Werte (sowohl nach oben als auch nach unten) die (über einen bestimmten Faktor hinaus von den anderen Ergebnissen abweicht und daher würde ein "normaler" Mittelwert ein verfälschtes Ergebnis liefern.


So was versuche ich nun schon die ganze Zeit für die Varianz zu machen

Die Varianz ist ???? Rolling Eyes Rolling Eyes

Sorry , vielleicht bin ich da echt zu doof für -


Mein Problem ist irgendwie , das ich vielleicht noch mit Müh und Not und den entsprechend gut formulierten Anweisungen in deinem Arbeitsblatt die Formeln geschrieben bekomme, aber mir jeglicher Bezug fehlt was ich da warum mache.

Ich mach für heute Schluss , .... mal sehen .... morgen früh nach dem Motto "neuer Tag neues Glück !"

Vielleicht fällt dann auch bei mir der Groschen (wahrscheinlich pfennigweise Razz )

Ich hoffe ich nerve nicht zu sehr mit meinen Nachfragen und halte den Betrieb nicht zu sehr auf.

_________________
Gruß
Andreas E
------
Oh Mann, ich fühl mich heute wie =DATEDIF(DATUM(1961;6;12);HEUTE();"y") Jahre alt
E4M
Excel-Moderator


Verfasst am:
09. Feb 2007, 01:26
Rufname:

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo Andreas,

Zitat:
Verstehe ich das richtig, daß Varianz etwas definiertes ist ? (Mit mehreren Definitionsmöglichkeiten)

Wir befinden uns (noch) in der beschreibenden Statistik, d.h. uns liegen
alle Daten vor und möchten diese mit Hilfe von Maßen beschreiben.

In der induktiven Statistik liegen uns nicht
alle Daten, sondern lediglich eine oder mehrere Stichproben vor, mit
denen man auf die Grundgesamtheit schließen möchte.
Beispiel: Wahlen.
Du gehst in die Fussgängerzone und befragst zufällig einige Passanten,
welche Partei sie bei der nächsten Bundestagswahl wählen würden (sowie
evtl. Geschlecht, Alter, Einkommen, Beruf etc.). Aus den Daten Deiner
Stichprobe möchtest Du nun auf die Ergebnisse der bevorstehenden
Bundestagswahl für ganz Deutschland schließen (Prognose).

Während in der beschreibenden Statistik die Varianz i.d.R.
s^2= 1/n *summe(xi - xquer)^2
(entspricht der Excel-Funktion VARIANZEN) benutzt wird,
ist in der induktiven Statistik die (empirische) Varianz definiert als
s^2= 1/(n-1) *summe(xi - xquer)^2
(entspricht der Excel-Funktion VARIANZ).

Letztere hat eine wichtige Eigenschaft (Grund warum sie auch benutzt wird):
Sie ist ein erwartungstreuer Schätzer für die Varianz


Fazit:
Wir benutzen VARIANZEN.



Zitat:
Was mir dann immer noch nicht klar ist, was bitte ist nun der Sinn bzw. Unterschied zwischen Varianz und Standardabweichung?

s := Standardabweichung
s^2 := Varianz
Es gilt: s = wurzel (s^2).
Die Standardabweichung ist die (positive) Wurzel aus der Varianz.
s hat die gleiche Einheit wie das Merkmal, s^2 die Einheit im Quadrat.
Vergleiche den letzten Absatz meines vorherigen Beitrags.



Zitat:
Die Varianz ist ????

Einführendes Beispiel: Du versuchst nacheinander 10 Kirschkerne genau
auf eine 2m von Dir entfernte Linie zu spucken. Nachdem Du dies
gemacht hast, misst Du jeweils den Abstand eines Kirschkerns zur Linie.
Ist der Kirschkern weniger als 2m weit geflogen notierst Du einen
negativen "Abstand", ist er weiter als 2m geflogen einen positiven
Abstand. Summierst Du nun alle Abstände, so heben sich negative und
positive Abweichungen teiweise oder gar ganz auf. D.h. eine Aussage wie
stark nun die Kirschkerne von der Linie streuen, ist auf diese Weise i.d.R.
nicht möglich (es sei denn es liegen alle Kerne vor oder alle hinter und /
oder alle auf der Linie). Daher greift man (im Fall der Varianz) zu quadrierten Abweichungen.

Zurück zu unserem Beispiel: Jetzt soll nicht ein im voraus bestimmter
Wert (also nicht die 2m entfernt liegende Linie), sondern der Mittelwert
der Daten der Wert sein, von dem die (quadrierten) Abweichungen berechnet werden.
Eine schematische Darstellung der Abweichungen aus unserem Beispiel
kann so aussehen:



Die gestrichelte, quer verlaufende Linie zeigt den Mittelwert xquer = 10.
Die Abweichungen der einzelnen Werte xi zum Mittelwert (xi - xquer) sind
durch die Fehlerindikatoren (vertikale Linien) dargestellt.
Ist ein Wert xi geringer als der Mittelwert, so ist eine solche Abweichung negativ (z.B. i=5);
ist ein Wert xi größer als der Mittelwert, so ist diese positiv (z.B. i=3) und
bei einem Wert xi, der gleich dem Mittelwert ist, ist die Abweichung null (z.B. i=4).
Auf Grund der angesprochenden Problematik werden nun
genau diese Abweichungen (Spalte C im vorherigen Beitrag) quadriert
(Spalte D), d.h. (xi-xquer)^2. Dieser Ausdruck bewirkt, dass das Ergebnis
für alle i nicht negativ ist, da:
Das Quadrat aus einer positiven Zahl ist positiv (größer null).
Das Quadrat aus einer negativen Zahl ist positiv (größer null).
Null zum Quadrat ergibt null.

Summiert man nun alle Werte auf, so ist der Wert weiterhin positiv (genauer: nicht negativ). summe (xi - xquer)^2 >= 0

Teilt man diesen durch n(>0) erhält man die Varianz, welche dann
ebenfalls größer gleich null sein muss. s^2 = 1/n * summe (xi-xquer)^2 >= 0

D.h. die Varianz ist ein Streuungsmaß, bei dem zunächst für alle i die
Abweichung zum Mittelwert berechnet wird, diese Abweichungen dann
jeweils quadriert und anschließend aufsummiert werden. Letzlich wird
diese Summe durch die Anzahl der Daten n geteilt.

Je höher die Varianz, desto stärker streuen die Werte um den Mittelwert.

Warum der Mittelwert bei der Berechnung der Varianz herangezogen wird
und nicht ein anderes Maß sowie die dadurch entstehenden Vor- und
Nachteile sollen hier nicht diskutiert werden.
Übung: Wer Lust hat kann sich mal ein "besseres" (anderes)
Streuungsmaß ausdenken. Z.B. indem man den Mittelwert durch ein
robusteres Maß ersetzt und / oder begtragsmäßige Abweichungen
betrachtet.


That´s all folks!

Andy

P.S.: Hoffe, dass der ein oder andere (Nicht-)Mathematiker mich verbessert, falls etwas falsch dargestellt ist.
ae
Mein Name ist Ente


Verfasst am:
09. Feb 2007, 08:18
Rufname: Andreas
Wohnort: Reppenstedt bei Lüneburg

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo Andy,
vielen Dank daß Du dir die Mühe gemacht hast dies nochmals ausführlich zu erläutern.
( Laughing Auch nett, da bedanke ich mich dafür, daß mir schon morgens beim ersten Kaffee schwindelig wird Laughing )
Spaß beiseite -
Ich glaube so langsam die Spur aufnehmen zu können.
Die Rechenweise verschliesst sich mir im Moment noch ein wenig, aber ich hoffe im Laufe des Tages Zeit zu finden immer wieder mal ein bischen zu lesen und an dem Übungsbeispiel nachzuvollziehen.

Also so ganz spontan und nach dem errsten Kaffee, mal um zu kucken ob ich es der Spur nach verstanden habe:

ein "besseres" (anderes) Streuungsmaß wäre zB das Gestutztmittel, da es die extremen "Ausreisser" schon eliminiert hat ??

Und eine kleine Nachfrage noch

Ist oder wird es im Verlauf des Workshops wichtig, daß ich weiss bzw. herleiten kann warum die Formeln so lauten???

zB
s^2= 1/n *summe(xi - xquer)^2
(mir leuchtet da zB einfach nicht so recht ein, warum mit ^2 gearbeitet wird )
Macht man das nur, weil sonst wie bei deinem Kirschkernbeispiel das ganze sich aufhebt, wenn einer alle vor bzw. alle nach (positive bzw. negative Werte) den Mittelwert spuckt ?


Ich hoffe ich bring dich mit den nachfragen nicht schon am frühen Morgen zum Verzweifeln

_________________
Gruß
Andreas E
------
Oh Mann, ich fühl mich heute wie =DATEDIF(DATUM(1961;6;12);HEUTE();"y") Jahre alt
ae
Mein Name ist Ente


Verfasst am:
09. Feb 2007, 08:40
Rufname: Andreas
Wohnort: Reppenstedt bei Lüneburg


AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Einen hab ich noch,

s^2= 1/(n-1) *summe(xi - xquer)^2

Woher kommt die -1 ??

n ist ja die Menge der Kirschkerne oder die Menge der Wahlberechtigten

Wenn ich bei dem Kirschkernspuckbeispiel bleibe, dann hatten wir ja zuerst betrachtet (beschreibende Statistik) wie die Kerne gespuckt wurden.

Nun kommt also Person 2 und spuckt einmal.

Spuckweite 1 12
Spuckweite 2 11

Im Gegensatz zum vorigen Beispiel wo alle Daten ausgewertet wurden, möchte ich ja nun bei der induktiven Statistik etwas prognostieren.

Der Spucker hier hat auch 10 Versuche wie vorher (also wäre n=10)
Warum aber, wird in der Formel bei der induktiven Staistik (Excel = Varianz) im Gegensatz zur Beschreibenden Statistik (Excel = Varianzen) mit n-1 gearbeitet?

2 Spuckversuche sind bereits da - 10 (n) sollen kommen -

warum dann n-1 ??? oder wäre es dann n-2 weil bereits 2 mal gespuckt wurde?

_________________
Gruß
Andreas E
------
Oh Mann, ich fühl mich heute wie =DATEDIF(DATUM(1961;6;12);HEUTE();"y") Jahre alt
E4M
Excel-Moderator


Verfasst am:
09. Feb 2007, 10:46
Rufname:

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo Andreas,

Zitat:
Ist oder wird es im Verlauf des Workshops wichtig, daß ich weiss bzw. herleiten kann warum die Formeln so lauten???

Klares nein! Ihr soll lediglich ein Gefühl dafür bekommen wie diese Maße
von Hand gerechnet werden können und welche Eigenschaften sie
haben.

Zitat:
ein "besseres" (anderes) Streuungsmaß wäre zB das
Gestutztmittel, da es die extremen "Ausreisser" schon eliminiert hat ??
Beinahe. Das Gestutztmittel (alpha-getrimmtes Mittel) ist wie
das arithmetisches Mittel ein Lagemaß. Aber eliminiert man formelmäßig
einen bestimmten Prozentsatz der kleinsten und größten Daten (die
Extremwerte) bei der Varianz, so erhält man die alpha-getrimmte Varianz
und somit ein anderes Streuungsmaß. Für unser Thema ist dieser Punkt aber
eher zweitrangig.


Zitat:
s^2= 1/n *summe(xi - xquer)^2
(mir leuchtet da zB einfach nicht so recht ein, warum mit ^2 gearbeitet wird )
Weil die Abweichungen (Differenzen zwischen xi und xquer) mal
positiv, mal negativ (und mal null) sein können uns sich in der Summe immer aufheben.
Diese Summe ist immer null! Eigenschaft des arithmetischen Mittels! (vgl. Aufgabe 4e))
Dies kann aber (bspw.) durch eine Quadrierung der
Abweichungen (Differenzen) umgangen werden. Positive und negative
Abweichungen heben sich nun nicht mehr auf. Wir haben ein Maß,
das die Streuung messen kann, gefunden.

Zitat:
s^2= 1/(n-1) *summe(xi - xquer)^2
Woher kommt die -1 ??

Manches muss man wissen, manches muss man glauben.
Dies musst Du glauben, da es bei unserem Thema zu sehr in eine andere
Richtung geht.
Es genügt uns zu wissen, dass es in Excel ebenfalls diese beiden
Varianzen gibt und wir diese unterscheiden können.

Grüße

Andy
ae
Mein Name ist Ente


Verfasst am:
09. Feb 2007, 10:53
Rufname: Andreas
Wohnort: Reppenstedt bei Lüneburg

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo Andy,

das beruhigt mich nun ein wenig -

Ich glaube jetzt auch das ^2 verstanden zu haben -
Im Grunde nix als ein Trick oder Hilfsmittel das dafür sorgt, daß kein Null entsteht.

Zitat:
Manches muss man wissen, manches muss man glauben.
Dies musst Du glauben, da es bei unserem Thema zu sehr in eine andere
Richtung geht.
Es genügt uns zu wissen, dass es in Excel ebenfalls diese beiden
Varianzen gibt und wir diese unterscheiden können.


Damit kann ich gut leben -
Ich hatte nur versucht für mich einen Weg der Erkläung für die -1 zu finden.
Wenn das eben so ist und immer -1 , ok .... ein Punkt weniger der mir graue Haare macht ! Laughing

So, ich hoffe ich komme nun ein wenig weiter und muss nicht permanent durch Nachfragen nerven.
Danke für Deine Mühe.

_________________
Gruß
Andreas E
------
Oh Mann, ich fühl mich heute wie =DATEDIF(DATUM(1961;6;12);HEUTE();"y") Jahre alt
E4M
Excel-Moderator


Verfasst am:
09. Feb 2007, 11:26
Rufname:

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo Andreas,

Zitat:
Ich glaube jetzt auch das ^2 verstanden zu haben -
Im Grunde nix als ein Trick oder Hilfsmittel das dafür sorgt, daß kein Null entsteht.

Freut mich! Und genau, es ist ein Trick, ohne diesen die Statistiker die Koffer packen könnten.

Ich denke bzw. hoffe, dass die Erläuterungen auch allen anderen
weiterhelfen, die sich (noch) nicht getraut haben zu fragen bzw. noch nicht
allzu sehr mit den Maßen vertraut sind.

Grüße

Andy
tom_r
Anfänger


Verfasst am:
22. Feb 2007, 11:47
Rufname:
Wohnort: Pfungstadt

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hi Andy,

auch wenn es dich vielleicht nervt, ich muss doch noch mal etwas zurück

noch mal unser Ausgangsbeispiel

<P><blockquote>
 ABC
1Anzahl: n = 10 
2Mittelwert:10 
3   
4ixixi - xquer
518-2
62122
73133
84100
958-2
106111
1177-3
128100
139122
14109-1
15 Summe:0
</blockquote></P>


und Deine Aussage hierzu


Zitat:
Weil die Abweichungen (Differenzen zwischen xi und xquer) mal
positiv, mal negativ (und mal null) sein können uns sich in der Summe immer aufheben.
Diese Summe ist immer null! Eigenschaft des arithmetischen Mittels!


Aber hier trifft das offensichtlich nicht zu (oder hab ich jetzt wieder was falsch verstanden?)

<P><blockquote>
 ABC
1Mittelwert9,6 
2   
3xixi - xquer 
48-1,6 
5100,4 
6111,4 
7100,4 
88-1,6 
9111,4 
107-2,6 
11100,4 
12122,4 
139-0,6 
14Summe:3,5527E-15 
</blockquote></P>


Gruß

Thomas
E4M
Excel-Moderator


Verfasst am:
22. Feb 2007, 14:02
Rufname:

AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hi Thomas,

rechne die Summe mal mit dem Taschenrechner / von Hand nach.
Diese Summe ist dann (immer) null.

Die Zahl die Du in Excel erhältst liegt an der Gleitkomma-Arithmetik in Excel
und ist sehr nahe an null. Dies sollte uns nicht weiter stören.

Formatiere dieses Ergebnis mal als (normale) Zahl mit zwei
Nachkommastellen.

Siehe zur Gleitkomma-Arithmetik auch:
http://support.microsoft.com/kb/78113/de

Grüße

Andy
tom_r
Anfänger


Verfasst am:
22. Feb 2007, 14:08
Rufname:
Wohnort: Pfungstadt


AW: Aufgabenblatt1 - AW: Aufgabenblatt1

Nach oben
       

Hallo Andy,

Du hast natürlich Recht, es gibt 0

Danke für die erklärung

Gruß

Thomas
Neues Thema eröffnen   Neue Antwort erstellen Alle Zeiten sind
GMT + 1 Stunde

Gehe zu Seite Zurück  1, 2
Diese Seite Freunden empfehlen

Seite 2 von 2
Gehe zu:  
Du kannst Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Du kannst Dateien in diesem Forum nicht posten
Du kannst Dateien in diesem Forum herunterladen

----> Diese Seite Freunden empfehlen <------ Impressum - Besuchen Sie auch: Word VBA