Type in the content of your page here.

Anexo I Descripción de la muestra


Cada año, durante la realización del tratamiento estadístico de las variables estudiadas y la redacción de este informe, encontramos más y mejor información para conocer e interpretar los datos que arrojan las pruebas aplicadas.
Y mientras mas cosas conocemos mas nos damos cuenta de la complejidad del análisis estadístico y de la dificultad para interpretar correctamente los resultados obtenidos.
A veces ocurre que la prueba utilizada no es tan potente como inicialmente la información utilizada nos hacia creer. Este es el caso de la prueba K-S que se ve afectada por muestras pequeñas (de menos de 100 sujetos) y no resulta tan potente para evaluar la normalidad de la distribución de frecuencias.
En ocasiones el sesgo y la curtosis tienen un comportamiento distinto por nivel educativo. La curva normal también evidencia que el agrupamiento de frecuencias es distinto en cada nivel y esto puede ser debido a multitud de causas como: situación peculiar del grupo de alumnos, numero de sujetos de cada nivel (en muestras pequeñas puede afectarse el resultado por características especiales presentes en ese grupo e alumnos). También puede verse afectado por como hemos obtenido los valores de la variable, en el caso de la nota global se obtiene por la apreciación general que el profesor tiene del alumno en un rango de 1 a 10 que puede verse afectado por el “efecto Pigmalion”: percepción subjetiva del esfuerzo del alumno, su participación en clase o su actitud general (en esta evaluación la nota no es el resultado de una prueba común para los alumnos de cada nivel de la muestra general). O por las características de la prueba de comprensión lectora: redacción de ítems, clase de ítems utilizados, contenido, estructura formal de la pregunta, enunciado…
Igualmente zona geográfica, social, cultural o económica de la que se extrae la muestra…
Además, como en replicas anteriores los alumnos y centros que participan lo hacen por interés de los tutores de cada nivel con lo que la población o los sujetos no se seleccionan de acuerdo a algún criterio o variable. Por ejemplo, seleccionar el mismo número de sujetos de cada nivel o no realizar evaluación del nivel donde la muestra de alumnos sea muy pequeña. Esto da pié a acumulaciones de frecuencias muy altas en niveles donde la participaron es mayor con lo que de una evaluación a otra pueden presentarse ligeras diferencias entre esos niveles y puntualmente, si la muestra es muy pequeña, discrepancias. Y en esto no podemos ni queremos intervenir dado que preferimos incluir todos los datos obtenidos pues suponen un esfuerzo del tutor y del centro al que va dirigido este informe.

Por eso interesa validar los resultados a través de futuras y réplicas en las que se estudian estas mismas variables.
Esto es así porque lo que nos interesa es obtener un perfil de la zona y de los centros para cada variable de manera que podamos conocer como evoluciona en futuras réplicas, bien de forma natural o por aplicación de iniciativas o programas para mejorarlas.

Sí hemos encontrado interesante conocer las medias y desviaciones típicas de las variables estudiadas, sobretodo en el caso de la velocidad lectora oral. Y también como la correlación estadística entre las variables estudiadas mantiene unos patrones similares nivel a nivel como ya hemos visto.

En el Anexo II y III proporcionamos un listado de las pruebas efectuadas y los resultados que proporciona el SPSS en relación a las pruebas “reglamentarias” o requisitos a que debe someterse cada variable estudiada para verificar que pueden aplicársele pruebas paramétricas[[#_ftn1|[1]]]. El propósito es permitir profundizar a interesados y/o expertos en estadística y verificar si los resultados expresados en esta evaluación son homologables o equivalentes con futuras replicas.

Estos requisitos son[[#_ftn2|[2]]]:

A) Son variables cuantitativas continuas
B) La muestra procede de una población que se distribuye según la ley normal, prueba de Kolmogorov-Smirnov.
C) Existe homoscedasticidad: Que una variable cumpla esta propiedad quiere decir que las varianzas de las distintas variables son iguales[[#_ftn3|[3]]].
D) La muestra es grande

A) Son variables cuantitativas continuas
Por la forma en que medimos las variables pueden ser cualitativas y cuantitativas.

· Las cualitativas presentan valores que no se pueden medir adjudicando valores según cada medida. Por ejemplo: verdadero o falso; abierto, cerrado; joven, viejo... Aunque a veces estas variables pueden cuantificarse. Por ejemplo viejo en el intervalo de edades de 40 a 100 y joven en el de 1 a 40. Podrían convertirse en cuantitativas si el investigador lo desea. En este estudio usamos la variable notas globales como cualitativa con el propósito de verificar que medias alcanzan las demás variables en relación con la nota global conseguida. Aunque le hacemos algunas pruebas paramétricas (correlación) por ejemplo en relación a las demás variables (podríamos considerarla entonces como cuantitativa).

· Las cuantitativas pueden ser discretas que suelen ser números enteros. Por ejemplo número de asignaturas, de aulas, de mesas... Y continúas como la edad, la velocidad lectora, la puntuación en una prueba de comprensión... [[#_ftn4|[4]]]

B) La muestra procede de una población que se distribuye según la ley normal
En realidad solo es necesario aplicar la prueba de Kolmogorov-Smirnov, “probablemente la mas adecuada para comprobar si una distribución empírica se ajusta a la ley normal”[[#_ftn5|[5]]]. Se entiende que se ajustan lo máximo posible a una distribución de frecuencias acumuladas previamente establecidas o esperadas y las observadas en la muestra de estudio[[#_ftn6|[6]]] y en consecuencia pueden aplicársele a las variables pruebas paramétricas.
También hemos representado en un gráfico la curva de frecuencias y damos su sesgo y curtosis para verificar su comportamiento en futuras réplicas.
Las variables en las que vamos a verificar si su distribución de frecuencias se ajusta a la ley normal son: edad, velocidad lectora oral, nota global de fin de curso, comprensión lectora y prueba IGF. Conocer si las variables se ajustan a la curva normal y si esto ocurre también en replicas de este informe ayuda a dar fiabilidad y validez a los datos obtenido y las inferencias realizadas.
Nosotros lo verificaremos para la muestra general y en cada nivel. Esto puede ser algo complejo de entender por la cantidad de datos que se proporcionan, sin embargo nos ayudara a conocer el comportamiento de estas variables en cada nivel y como siguen o no un patrón. Así mismo veremos como las variables en la muestra general tienen un comportamiento y resultados distintos a cuando los estudiamos nivel a nivel.

Conclusiones de la prueba K-S:
En el Anexo III pueden verse los resultados de la prueba K-S. Parece que en la muestra general tiene tendencia a no presentar una distribución de frecuencias adecuada, en cambio por niveles tiende a acreditar una mejor distribución de las frecuencias: Esto lo indica el echo de que
Asymp. Sig. (2-tailed) es mayor de 0.05 en la mayoría de las ocasiones en las distintas variables y niveles, es lo que nos interesa.

C) Homoscedasticidad
Que una variable cumpla esta propiedad quiere decir que las varianzas de las distintas variables son iguales. Realmente no quiere decir que sean exactamente iguales, sino dentro de la probabilidad establecida, es decir para una significación de 0,05 o mejor (más baja).
La calcularemos para las variables edad, velocidad lectora, nota global, comprensión lectora e IGF

La prueba a utilizar es la de Levene.

Conclusiones
Las variables que obtienen en esta prueba un grado de significación menor del previsto (0.05) presentan diferencias entre las varianzas. Obsérvese el comportamiento en la muestra general y nivel a nivel, donde es más estable valores de significación superiores a 0.05 que es lo que buscamos: las varianzas son iguales.

También (como curiosidad y ampliación) indicamos los resultados de la prueba Anova donde podremos observar si existen diferencias entre las medias de las variables utilizadas. El grado de significación menor de 0.05 indica que existen diferencias ente las medias de los distintos niveles de la variable estudiada. En el Anexo III busquemos la tabla similar a esta:



ANOVA
Velocidad lectora




Sum of Squares
df
Mean Square
F
Sig.
Between Groups
191065.760
5
38213.152
54.131
.000
Within Groups
384027.484
544
705.933


Total
575093.244
549




Este hecho (para mas curiosidad y ampliación) lo podemos verificar a través de la prueba de Scheffe que nos indica entre que niveles existen diferencias significativas en las medias. Compara a cada nivel con los demás. El asterisco indica que existen diferencias entre las medias superiores al 0.5 %. Observamos que esa diferencia es frecuente entre los niveles de la variable edad y velocidad lectora aunque a veces no aparece en niveles contiguos. Obsérvese como en esta prueba las variables nota global y comprensión lectora funciona distinto, no muestran diferencias entre niveles. Es debido al rango de los valores de la prueba.
Conocer sobre las diferencias en las medias y la prueba Scheffe no es necesario para conocer sobre las varianzas. Lo ponemos para conocer sobre el comportamiento de estas variables y porque seria un procedimiento útil para conocer sobre el tratamiento o intervención educativa para mejorar la competencia en una variable: que iniciativa es la que produce mejores resultados si el grupo en que se aplica o en el que no.

D) Tamaño de la muestra para las variables estudiadas.
En el libro citado en la bibliografía "Introducción a la estadística aplicada a la investigación educativa", en su pagina 94 se indica que un tamaño válido podría ser de mas de 30 sujetos[[#_ftn7|[7]]].
El tener una muestra amplia da mayor fiabilidad y validez, muestras pequeñas pueden dar resultados inesperados, inadecuados o representativos de una muestra puntual pero que no seria adecuado generalizarlos.
Obsérvese este dato en las pruebas de sesgo (simetría) y curtosis donde se indica el número de sujetos de los que disponemos datos (N) y de los que no se nos facilita datos por faltar el día del pase de la prueba u otras causas (mising).

Anexo II Listado de las pruebas aplicadas

Para el analisis estadistico se ha utilizado una 'demo' del programa estadistico SPSS. En el Anexo III se puede consultar el resultado obtenido. Este es el listado que da el programa de las pruebas que se han utilizado:

FILTER OFF.
USE ALL.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= edad vlectora notaglob igf complect
/MISSING ANALYSIS.
FREQUENCIES
VARIABLES=edad vlectora notaglob igf complect /FORMAT=NOTABLE
/STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .
USE ALL.
COMPUTE filter_$=(nivel = 1).
VARIABLE LABEL filter_$ 'nivel = 1 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= edad vlectora notaglob igf complect
/MISSING ANALYSIS.
FREQUENCIES
VARIABLES=edad vlectora notaglob igf complect /FORMAT=NOTABLE
/STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .
USE ALL.
COMPUTE filter_$=(nivel = 2).
VARIABLE LABEL filter_$ 'nivel = 2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= edad vlectora notaglob igf complect
/MISSING ANALYSIS.
FREQUENCIES
VARIABLES=edad vlectora notaglob igf complect /FORMAT=NOTABLE
/STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .
USE ALL.
COMPUTE filter_$=(nivel = 3).
VARIABLE LABEL filter_$ 'nivel = 3 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= edad vlectora notaglob igf complect
/MISSING ANALYSIS.
FREQUENCIES
VARIABLES=edad vlectora notaglob igf complect /FORMAT=NOTABLE
/STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .
USE ALL.
COMPUTE filter_$=(nivel = 4).
VARIABLE LABEL filter_$ 'nivel = 4 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= edad vlectora notaglob igf complect
/MISSING ANALYSIS.
FREQUENCIES
VARIABLES=edad vlectora notaglob igf complect /FORMAT=NOTABLE
/STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .
USE ALL.
COMPUTE filter_$=(nivel = 5).
VARIABLE LABEL filter_$ 'nivel = 5 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= edad vlectora notaglob igf complect
/MISSING ANALYSIS.
FREQUENCIES
VARIABLES=edad vlectora notaglob igf complect /FORMAT=NOTABLE
/STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .
USE ALL.
COMPUTE filter_$=(nivel = 6).
VARIABLE LABEL filter_$ 'nivel = 6 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
NPAR TESTS
/K-S(NORMAL)= edad vlectora notaglob igf complect
/MISSING ANALYSIS.
FREQUENCIES
VARIABLES=edad vlectora notaglob igf complect /FORMAT=NOTABLE
/STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .

FILTER OFF.
ONEWAY
edad BY nivel
/STATISTICS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC = SCHEFFE ALPHA(.05).
ONEWAY
vlectora BY nivel
/STATISTICS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC = SCHEFFE ALPHA(.05).
ONEWAY
notaglob BY nivel
/STATISTICS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC = SCHEFFE ALPHA(.05).
ONEWAY
igf BY nivel
/STATISTICS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC = SCHEFFE ALPHA(.05).
ONEWAY
complect BY nivel
/STATISTICS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC = SCHEFFE ALPHA(.05).

[[#_ftnref1|[1]]] Por ejemplo las que usamos en esta evaluación: media, desviación típica, simetría y curtosis, análisis de varianza…
[[#_ftnref2|[2]]] Rafael Bisquerra 'Introducción a la estadística aplicada a la investigación educativa', pagina 94, en el apartado 'Supuestos paramétricos'
[[#_ftnref3|[3]]] Realmente no quiere decir que sean exactamente iguales, sino dentro de la probabilidad establecida, es decir para una significación de 0,05 (o mejor).
[[#_ftnref4|[4]]] Para más información sobre variables ver: Fred N. Kerlinger, Investigación del comportamiento, capitulo 3, (muy completo) o Bisquerra, obra citada pagina 9 a12.
[[#_ftnref5|[5]]] Introducción a la estadística aplicada a la investigación educativa, Rafael Bisquerra, página 225, (Aunque ya hemos comentado sobre las limitaciones de esta prueba).
[[#_ftnref6|[6]]] Exteberria, Juan y otros, Programación y análisis estadísticos básicos con SPSS, página 306-307.
[[#_ftnref7|[7]]] Sin embargo, pensamos que con muestras mayores los resultados de las pruebas serian más estables. Ya hemos indicado como por ejemplo para la prueba K-S se recomienda muestras por encima de 100 sujetos.