Teoria
Aprèn els conceptes bàsics de l'estadística, com organitzar dades en taules, calcular paràmetres de centralització i representar informació amb gràfics.
Benvingut/da a la unitat d’estadística! L’estadística és una branca de les matemàtiques que ens ajuda a recollir, organitzar, analitzar i interpretar dades. La fem servir cada dia per entendre el món que ens envolta, des de les enquestes d’opinió fins a l’anàlisi de resultats esportius. Comencem a descobrir els seus secrets!
17.1. Conceptes bàsics en estadística
Abans de començar a treballar amb dades, hem de conèixer alguns conceptes fonamentals que són la base de qualsevol estudi estadístic.
Mostra i Població
Imagina que vols saber quin és el color preferit de tots els estudiants del teu país. Preguntar-los a tots seria impossible! Per això, en estadística, diferenciem entre dos grups:
- Població: És el conjunt complet de tots els individus o elements que volem estudiar. En el nostre exemple, la població serien tots els estudiants del país.
- Mostra: És un subconjunt més petit de la població que seleccionem per estudiar. És important que la mostra sigui representativa, és a dir, que reflecteixi les característiques de la població general. En el nostre exemple, podríem seleccionar 1.000 estudiants de diferents ciutats per formar la nostra mostra.
Estudiem la mostra per treure conclusions sobre la població sencera.
Variables Estadístiques
Una variable estadística és la característica que estudiem en els individus de la mostra o població. Per exemple, si estudiem estudiants, les variables podrien ser l’edat, l’alçada, el color de cabell o la nota mitjana.
Les variables es classifiquen en dos grans grups:
-
Variables Qualitatives: Descriuen una qualitat o característica que no es pot mesurar amb números. Per exemple: el color dels ulls (marrons, blaus, verds), l’esport preferit (futbol, bàsquet, tennis) o el gènere musical favorit (pop, rock, clàssica).
-
Variables Quantitatives: Descriuen una quantitat que sí que es pot mesurar amb números. Aquestes, al seu torn, es divideixen en dos tipus:
- Discretes: Només poden prendre valors aïllats, normalment nombres enters. No hi ha valors intermedis. Exemples: el nombre de germans (pots tenir 1, 2, 3 germans, però no 2.5), el nombre de gols en un partit o el nombre de llibres en una prestatgeria.
- Contínues: Poden prendre qualsevol valor dins d’un interval. Entre dos valors, sempre en podem trobar un d’intermedi. Exemples: l’alçada d’una persona (pot ser 1.75 m, 1.751 m, 1.7512 m…), el pes o la temperatura.
(Qualitats)
(Nombres)
(Valors aïllats)
(Qualsevol valor)
17.2. Recollida i organització de dades
Un cop sabem què volem estudiar, el següent pas és recollir les dades i organitzar-les de manera que siguin fàcils d’entendre. La millor eina per a això són les taules estadístiques.
Taules estadístiques
Una taula de freqüències ens permet resumir la informació d’un conjunt de dades. Conté diverses columnes importants:
- Freqüència Absoluta (): És el nombre de vegades que apareix cada valor o dada.
- Freqüència Relativa (): És la proporció de vegades que apareix cada valor. Es calcula dividint la freqüència absoluta entre el nombre total de dades (N). . La suma de totes les freqüències relatives sempre és 1.
- Freqüències Acumulades ( i ): Sumen les freqüències dels valors inferiors o iguals a l’actual. La freqüència absoluta acumulada () suma les , i la freqüència relativa acumulada () suma les . L’últim valor de la freqüència acumulada sempre és el total (N o 1).
- Percentatge (%): És la freqüència relativa multiplicada per 100. Ens diu quin tant per cent del total representa cada valor. La suma de tots els percentatges ha de ser 100%.
Exemple resolt: Notes d’un examen
Hem preguntat a 20 estudiants la seva nota en un examen i hem obtingut els següents resultats:
7, 8, 6, 9, 7, 8, 10, 5, 6, 7, 8, 9, 7, 6, 8, 5, 7, 9, 8, 7
Organitzem aquestes dades en una taula de freqüències:
| Nota (xᵢ) | Freq. Absoluta (fᵢ) | Freq. Relativa (hᵢ) | Freq. Abs. Acum. (Fᵢ) | Freq. Rel. Acum. (Hᵢ) | Percentatge (%) |
|---|---|---|---|---|---|
| 5 | 2 | 2/20 = 0.10 | 2 | 0.10 | 10% |
| 6 | 3 | 3/20 = 0.15 | 2+3 = 5 | 0.10+0.15=0.25 | 15% |
| 7 | 6 | 6/20 = 0.30 | 5+6 = 11 | 0.25+0.30=0.55 | 30% |
| 8 | 5 | 5/20 = 0.25 | 11+5 = 16 | 0.55+0.25=0.80 | 25% |
| 9 | 3 | 3/20 = 0.15 | 16+3 = 19 | 0.80+0.15=0.95 | 15% |
| 10 | 1 | 1/20 = 0.05 | 19+1 = 20 | 0.95+0.05=1.00 | 5% |
| TOTAL | 20 | 1.00 | - | - | 100% |
Aquesta taula ens permet veure ràpidament que la nota més comuna és un 7 (freqüència absoluta de 6) i que el 80% dels estudiants han tret un 8 o menys (freqüència relativa acumulada de 0.80).
Paràmetres de centralització
Els paràmetres de centralització són valors que resumeixen un conjunt de dades en un sol número, indicant el “centre” de la distribució. Els tres més importants són:
-
Mitjana Aritmètica (): És el valor que coneixem com a “promig”. Es calcula sumant tots els valors i dividint el resultat pel nombre total de dades.
- Exemple: Per a les dades
2, 3, 7, la mitjana és .
- Exemple: Per a les dades
-
Mediana (): És el valor que es troba exactament al mig del conjunt de dades quan aquestes estan ordenades de menor a major. Si hi ha un nombre parell de dades, la mediana és la mitjana dels dos valors centrals.
- Exemple (imparell): Per a les dades ordenades
2, 3, 7, la mediana és 3. - Exemple (parell): Per a les dades ordenades
2, 3, 7, 9, la mediana és .
- Exemple (imparell): Per a les dades ordenades
-
Moda (): És el valor que apareix amb més freqüència en el conjunt de dades. Un conjunt de dades pot tenir més d’una moda (bimodal, trimodal…) o cap.
- Exemple: Per a les dades
2, 3, 7, 3, 8, 3, la moda és 3 perquè és el que més es repeteix.
- Exemple: Per a les dades
17.3. Representació gràfica i anàlisi de dades
Els gràfics estadístics són una eina visual molt potent per representar dades i facilitar-ne la interpretació.
Tipus de gràfics estadístics
Diagrama de Barres
S’utilitza principalment per a variables qualitatives i quantitatives discretes. A l’eix horitzontal (X) es col·loquen els valors de la variable, i a l’eix vertical (Y), les freqüències. L’alçada de cada barra representa la freqüència d’aquesta dada. Les barres estan separades entre si.
Histograma
És molt similar al diagrama de barres, però s’utilitza per a variables quantitatives contínues. Les dades s’agrupen en intervals (classes) i les barres es dibuixen juntes, sense separació, per indicar la continuïtat dels valors.
Diagrama de Sectors (o Gràfic Circular)
Representa les dades en un cercle dividit en sectors. L’àrea de cada sector és proporcional a la freqüència (generalment el percentatge) de la dada que representa. És molt útil per veure la proporció de cada categoria respecte al total.
- 1 hora (15%)
- 2 hores (40%)
- 3 hores (30%)
- 4 hores (15%)
Ús de la calculadora i aplicacions informàtiques
Avui en dia, no cal fer tots aquests càlculs i gràfics a mà. Les calculadores científiques poden calcular automàticament la mitjana i altres paràmetres. A més, programes com fulls de càlcul (Excel, Google Sheets) són eines molt potents que permeten crear taules i tota mena de gràfics estadístics de manera ràpida i professional amb només uns clics.
Resolució de problemes aplicats
L’estadística és fonamental per resoldre problemes de la vida quotidiana i professional. Per exemple:
- Una empresa pot analitzar les dades de vendes per decidir quin producte promocionar.
- Un ajuntament pot estudiar la població per saber on cal construir una nova escola.
- Un metge pot interpretar els resultats d’un estudi per saber si un medicament és eficaç.
Saber interpretar dades i gràfics et dona el poder de prendre decisions informades basades en evidències.
Exercicis Interactius
Ara és el teu torn! Resol aquests exercicis per posar a prova els teus coneixements.
Quiz de Conceptes Bàsics
Quiz
1. Si volem estudiar l'opinió de tots els habitants de Catalunya però només enquestem 2.000 persones, què són aquestes 2.000 persones?
2. El 'color de cabell' és un exemple de quina mena de variable?
3. El 'nombre de mascotes' que té una família és una variable...
Quiz d’Interpretació de Dades
Quiz
1. Quin paràmetre de centralització es calcula sumant totes les dades i dividint pel nombre total de dades?
2. En el conjunt de dades: 2, 5, 8, 5, 3. Quina és la moda?
3. Per a quin tipus de variable faries servir un histograma?
Quiz de Taules i Gràfics
Quiz
1. La freqüència relativa es calcula...
2. Si la freqüència relativa d'una dada és 0.25, quin és el seu percentatge?
3. Un diagrama de sectors és ideal per a...
Relaciona Conceptes
Matching Exercise
Drag the items on the right to match the descriptions on the left.
Completa la Frase
Drag the Words
Drag the words from the bank into the correct blanks in the text.
Problemes Pas a Pas
Problem Solving
Calcula la mediana del següent conjunt de dades: 5, 8, 4, 10, 3.
Problem Solving
Calcula la mitjana del següent conjunt de dades: 2, 10, 4, 4.
Problem Solving
En una classe de 10 persones, 3 prefereixen el color Vermell, 5 el Blau i 2 el Verd. Calcula el percentatge que prefereix el Vermell.
Càlculs Ràpids
Calcula la Mitjana
Troba la Moda i la Mediana
Exercicis per practicar
Resol les següents preguntes i problemes al teu quadern per consolidar el que has après.