jueves, 17 de septiembre de 2015

Estadística y método cientifico






La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. 



El método científico
Es la explicación, descripción y predicción de fenómenos cuyo objetivo primordial es obtener con mayor facilidad el conocimiento científico.
Podemos definir el método científico como el proceso que sigue la comunidad científica para dar respuesta a sus interrogantes, la secuencia de procedimientos que usa para confirmar como regla o conocimiento lo que en origen es una mera hipótesis. El método científico está basado en los principios de reproducibilidad y falsabilidad y consta fundamentalmente de cinco pasos:
1. Observación
Análisis sensorial sobre algo -una cosa, un hecho, un fenómeno,…- que despierta curiosidad. Conviene que la observación sea detenida, concisa y numerosa, no en vano es el punto de partida del método y de ella depende en buena medida el éxito del proceso.
2. Hipótesis
Es la explicación que se le da al hecho o fenómeno observado con anterioridad. Puede haber varias hipótesis para una misma cosa o acontecimiento y éstas no han de ser tomadas nunca como verdaderas, sino que serán sometidas a experimentos posteriores para confirmar su veracidad.
3. Experimentación
Esta fase del método científico consiste en probar -experimentar- para verificar la validez de las hipótesis planteadas o descartarlas, parcialmente o en su totalidad.
4. Teoría
Se hacen teorías de aquellas hipótesis con más probabilidad de confirmarse como ciertas.

5. Ley
Una hipótesis se convierte en ley cuando queda demostrada mediante la experimentación.
Los principios de reproducibilidad y falsabilidad del método científico, mencionados en el primer párrafo, consisten en la capacidad de repetir un determinado experimento en cualquier lugar y por cualquier persona, así como la posibilidad de que cualquier proposición científica sea refutada o falsada.
CARACTERÍSTICAS DEL MÉTODO CIENTÍFICO
  • §  Verificación empírica: Utiliza la comprobación de los hechos para formular y resolver problemas.
  • §  Experimentación controlada: Define, mide y controla las variables del problema por resolver con el fin de obtener soluciones científicas.
  • §  Búsqueda de generalizaciones más amplias: La solución práctica a un problema es sólo un medio y no el fin del método científico.
  • §  Se fundamenta en un cuerpo de generalizaciones ya existentes: Intenta crear un sistema teórico nuevo con base en lo que ya se tiene.
  • §  Va más allá de los hechos: Parte de los hechos tal y como son para encontrar causas, efectos y algo más.
  • §  Objetividad: Busca la verdad independiente de la escala de valores y criterio personal del investigador.
  • §  Existe una estrecha relación entre la teoría y el método.
  • §  Es fáctico, siempre se refiere a los hechos. 



Población, Muestra y Variable estadistica.



 La población de un estudio estadístico es el conjunto de elementos objeto de estudio. Cada elemento se denomina individuo. Cuando el número de individuos de la población es muy grande, tomamos una parte de ésta, denominada muestra. 
  • La muestra es un subconjunto de la población y tiene que ser representativa de la misma. 
  • La variable estadística es la propiedad o característica de la población que estamos interesados en estudiar. Puede ser cualitativa o cuantitativa.  Las variables cualitativas toman valores no numéricos.  Las variables cuantitativas toman valores numéricos. Entre ellas, distinguimos dos tipos: discretas y continuas. - Las variables cuantitativas discretas no pueden tomar valores intermedios entre dos valores posibles consecutivos. - Las variables cuantitativas continuas pueden tomar valores intermedios entre dos valores tan próximos como deseemos.

Probabilidad

LA PROBABILIDAD
Mide la mayor o menor posibilidad de que se dé un determinado resultado (suceso o evento) cuando se realiza un experimento aleatorio.
Para calcular la probabilidad de un evento se toma en cuenta todos los casos posibles de ocurrencia del mismo; es decir, de cuántas formas puede ocurrir determinada situación.
Los casos favorables de ocurrencia de un evento serán los que cumplan con la condición que estamos buscando.

La estadística se divide en dos grandes áreas:
  • Estadística Descriptiva: procedimientos empleados para organizar y resumir conjuntos de observaciones en forma cuantitativa. El resumen de los puede hacerse mediante tablas, gráficos o valores numéricos. Los conjuntos de datos que contienen observaciones de más de una variable permiten estudiar la relación o asociación que existe entre ellas.
  • Estadística Inferencial: métodos empleados para inferir algo acerca de una población basándose en los datos obtenidos a partir de una muestra. Los datos estadísticos son cálculos aritméticos realizados sobre los valores obtenidos en una porción de la población, seleccionada según criterios rigurosos.



Muestreo y tipos de muestreo


MUESTREO

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. 

Los errores más comunes que se pueden cometer son: 
  1.  Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error de muestreo. 
  2.  Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomo la muestra. Error de Inferencia. 

En la estadística se usa la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio y el término muestra se usa para describir una porción escogida de la población. 

TIPOS DE MUESTREO

  • Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: 


  1.  Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.
  2. Muestreo aleatorio sistemáticoEste procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población.

  3. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población.

  4. Muestreo aleatorio por conglomerados: consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

  • Métodos de muestreo no probabilísticos  
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. 

Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos: 

  1.  Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
  2. Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).
  3. Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
  4. Muestreo Discrecional:  A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.

Fórmula para el cálculo de la muestra de poblaciones finitas

Para el cálculo de tamaño de muestra cuando el universo es finito, es decir contable y la variable de tipo categórica, primero debe conocer "N" ó sea el número total de casos esperados ó que ha habido en años anteriores (Por ejemplo, en el año 2009), para eso deben revisar los datos estadísticos del Departamento de Pediatría. Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la fórmula sería:

             Donde:
 • N = Total de la población 
• Zα= 1.96 al cuadrado (si la seguridad es del 95%) 
• p = proporción esperada (en este caso 5% = 0.05) 
• q = 1 – p (en este caso 1-0.05 = 0.95) • d = precisión (en su investigación use un 5%).