sábado, 24 de mayo de 2008
comentario
la teoria de Sheppard es un calculo estadistico que se aplica en situaciones en donde surgen errores de calculo, esto a su vewz se convierte en errores que suelen cambiar los resultados finales, y por eso es importante reconocer en que momento se debe de aplicar dicha formula, la cual nos dara resultados mas confiables y veridicos para exponerlos.
correccion de Sheppard
Corrección de Sheppard para la varianza
Una medida relacionada con la varianza es la corrección de Sheppard, esta medida sirve para corregir los errores que se cometen cuando se realizan cálculos de varianza para datos agrupados, su expresión es dada como:
varianza corregida= varianza de los datos agrupados -c2 (c al cuadrado)/12 y esta se conoce como la correcion de Sheppard.
La restricción que se impone para poder aplicar este tipo de corrección es el hecho que solo se puede aplicar para variables continuas, donde las colas de la distribución en ambas direcciones van a cero. Sin embargo, su inconveniencia esta en que la corrección puede modificar sustancialmente algunos resultados lo que con lleva a cometer otro error, lo que a generado mucha polémica sobre cuando usar la corrección.
Una medida relacionada con la varianza es la corrección de Sheppard, esta medida sirve para corregir los errores que se cometen cuando se realizan cálculos de varianza para datos agrupados, su expresión es dada como:
varianza corregida= varianza de los datos agrupados -c2 (c al cuadrado)/12 y esta se conoce como la correcion de Sheppard.
La restricción que se impone para poder aplicar este tipo de corrección es el hecho que solo se puede aplicar para variables continuas, donde las colas de la distribución en ambas direcciones van a cero. Sin embargo, su inconveniencia esta en que la corrección puede modificar sustancialmente algunos resultados lo que con lleva a cometer otro error, lo que a generado mucha polémica sobre cuando usar la corrección.
viernes, 23 de mayo de 2008
comentario de varianza
la varianza puede ser mal interpretada ya que varios autores estadisticos la comparan con la desviación tipica o estandar ya que su similitud es bastante pero es de importancia conocer que representa cada uno y la desviacion estandar representa a que distancia se escuentra cada dato uno de otro y la varianza representa que tan constante cambia un dato podemos tomar como base su nombre ya que varianza indica variedad o cambio, por alli podriamos partir para abordar este tema la varianza se aplica para saber la variacion de cualquier cosa como por ejemplo la variacion del precio de la gasolina, el pasaje, el precio de las verduras, etc. y asi sucesivamente hasta llegar al punto de estudio estadistico, esta herramienta estadistica nos sirve cuando se cometen errores en la distribución, al momento de fallar en el calculo del intevalo, amplitud o en algunos casos cuando hay datos con cero (0) de frecuencia y afecta la localizacion de datos. esta formula deriva de la teoria de Sheppard.
varianza
En teoría de probabilidad y estadística, la varianza es una medida de la dispersión de una variable aleatoria respecto a su esperanza.
Está relacionada con la desviación estándar o desviación típica, que se suele denotar por la letra griega σ y que es la raíz cuadrada de la varianza,
La varianza representa la media aritmética de las desviaciones con respecto a la media elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral
El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.
Por la formulación de la varianza podemos pasar a obtener la desviación estándar, tomando la raíz cuadrada positiva de la varianza. Así, si efectuamos la raíz de la varianza muestral, obtenemos la desviación típica muestral; y si por el contrario, efectuamos la raíz sobre la varianza poblacional, obtendremos la desviación típica poblacional.
Varianza (S2 o 2): Es el resultado de la división de la sumatoria de las distancias existentes entre cada dato y su media aritmética elevadas al cuadrado, y el número total de datos.
Distinguimos dos símbolos para identificar la varianza: S2 para datos muestrales, y σ2 para datos poblacionales. Note que la fórmula para la varianza muestral presenta en su denominador al tamaño de la muestra menos uno, tendencia adoptada por los estadísticos para denotar una varianza más conservadora.
Está relacionada con la desviación estándar o desviación típica, que se suele denotar por la letra griega σ y que es la raíz cuadrada de la varianza,
La varianza representa la media aritmética de las desviaciones con respecto a la media elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral
El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.
Por la formulación de la varianza podemos pasar a obtener la desviación estándar, tomando la raíz cuadrada positiva de la varianza. Así, si efectuamos la raíz de la varianza muestral, obtenemos la desviación típica muestral; y si por el contrario, efectuamos la raíz sobre la varianza poblacional, obtendremos la desviación típica poblacional.
Varianza (S2 o 2): Es el resultado de la división de la sumatoria de las distancias existentes entre cada dato y su media aritmética elevadas al cuadrado, y el número total de datos.
Distinguimos dos símbolos para identificar la varianza: S2 para datos muestrales, y σ2 para datos poblacionales. Note que la fórmula para la varianza muestral presenta en su denominador al tamaño de la muestra menos uno, tendencia adoptada por los estadísticos para denotar una varianza más conservadora.
jueves, 22 de mayo de 2008
comentario de diagrama de cajas o boxplot
Esta es una herramienta estadistica que nos ayuda a mostrar la dispersión de los datos tomamdo en cuenta que los que estan mas juntos son los que se encuentran entre el cuatil 1 y el cuartil 3,los que a su vez representan lo ancho del la caja y presenta valores atípicos que son los que encuentran muy dispersos o muy alejados estos quedan graficados fuera de la caja ya que por su dispersión son tomados en cuenta pero graficados aparte, este diagrama nos ayuda y facilita el entendimiento de la distribución ya que es una grafica facil de leer y las medias que utiliza son los cuatiles 1, 2 y 3 en donde el primero y el ultimo representan lo ancho de la caja, el cuartil 2 representa la mitad de la caja y es igual a la mediana y grafica la ubicación de la media, grafica barreras internas y externas ya en ellas se grafican los valor atipicos.
diagrama de cajas o boxplot
El diagrama de cajas tambien llamado boxplot es la presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.
Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.
Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:CIi = Q1 - PasoCIs = Q3 + PasoSi la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:CEi = CIi - PasoCEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.
"Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.
Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.
Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:CIi = Q1 - PasoCIs = Q3 + PasoSi la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:CEi = CIi - PasoCEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.
"Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.
sábado, 10 de mayo de 2008
relacion entre boxplot y las curvas
existe varias caracteristicas que relacionan al diagrama de cajas con las curvas ya que en ellas se pueden apreciar las medidas de tendia central, entre las cuales se observan la dispersion de los datos asi como asi como cuales son los mas dispersos asi como la concentracion de los mismos
sábado, 3 de mayo de 2008
comentario
el area bajo la curva nos servira para saber que porcentaje o numero de datos se encuentran en determinado lugar tomando como referencia la media o promedio, en lo que se trata del porcentaje bajo la curva normal es de que dicho porcentaje esta dividido en tres una parte positiva y la otra negativa cada una conteniedo casi 50% (la suma de los 6 porcentajes totales + y - no es 100%), el resultado que nos da luego de hallar el area bajo la curva lo buscamos en la tabla de area si en algunos casos nos da negativo no importa porque lo que indica es que se localiza del lado izquierdo (alli se encuentran los negativos), luego lo estandarizamos que no es mas que saber a cuantas desviaciones tipicas o estandar se encuentra dicho dato a partir de la media o punto de referencia.
area bajo la curva
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar.
comentario
el portafolios es una herramienta que es muy buena ya que con ella uno hace el trabajo de enseñanza-aprendizaje, en donde uno le pone mas interes al trabajo ya que se nos dan unos datos y nosatros somos los que investigamos y por lo tanto aprendemos mas para estar preparados para ponerlo en practica
Suscribirse a:
Entradas (Atom)