Comment calculer GPA dans Excel. Comment trouver la moyenne dans Excel

Dans la plupart des cas, les données sont concentrées autour d'un point central. Ainsi, pour décrire n'importe quel ensemble de données, il suffit d'indiquer la valeur moyenne. Considérons successivement trois caractéristiques numériques qui servent à estimer la valeur moyenne de la distribution : moyenne arithmétique, médiane et mode.

Moyenne

La moyenne arithmétique (souvent appelée simplement la moyenne) est l'estimation la plus courante de la moyenne d'une distribution. C'est le résultat de la division de la somme de toutes les valeurs numériques observées par leur nombre. Pour un échantillon de nombres X 1, X 2, ..., Xn, la moyenne de l'échantillon (désignée par le symbole ) équivaut à \u003d (X 1 + X 2 + ... + Xn) / n, ou

où est la moyenne de l'échantillon, n- taille de l'échantillon, Xje– ième élément de l'échantillon.

Télécharger note au format ou, exemples au format

Envisagez de calculer la moyenne arithmétique des rendements annuels moyens sur cinq ans de 15 fonds communs de placement à très haut risque (figure 1).

Riz. 1. Rendement annuel moyen de 15 fonds communs de placement à très haut risque

La moyenne de l'échantillon est calculée comme suit :

Il s'agit d'un bon rendement, surtout si on le compare au rendement de 3 à 4 % que les déposants des banques ou des coopératives de crédit ont reçu au cours de la même période. Si vous triez les valeurs de rendement, il est facile de voir que huit fonds ont un rendement supérieur et sept - inférieur à la moyenne. La moyenne arithmétique agit comme un point d'équilibre, de sorte que les fonds à faible revenu compensent les fonds à revenu élevé. Tous les éléments de l'échantillon interviennent dans le calcul de la moyenne. Aucun des autres estimateurs de la moyenne de distribution n'a cette propriété.

Quand calculer la moyenne arithmétique.Étant donné que la moyenne arithmétique dépend de tous les éléments de l'échantillon, la présence de valeurs extrêmes affecte considérablement le résultat. Dans de telles situations, la moyenne arithmétique peut fausser la signification des données numériques. Par conséquent, lors de la description d'un ensemble de données contenant des valeurs extrêmes, il est nécessaire d'indiquer la médiane ou la moyenne arithmétique et la médiane. Par exemple, si le rendement du fonds RS Emerging Growth est retiré de l'échantillon, la moyenne de l'échantillon du rendement des 14 fonds diminue de près de 1 % à 5,19 %.

Médian

La médiane est la valeur médiane d'un tableau ordonné de nombres. Si le tableau ne contient pas de nombres répétés, alors la moitié de ses éléments seront inférieurs et l'autre moitié supérieurs à la médiane. Si l'échantillon contient des valeurs extrêmes, il est préférable d'utiliser la médiane plutôt que la moyenne arithmétique pour estimer la moyenne. Pour calculer la médiane d'un échantillon, il faut d'abord le trier.

Cette formule est ambiguë. Son résultat dépend si le nombre est pair ou impair. n:

  • Si l'échantillon contient un nombre impair d'items, la médiane est (n+1)/2-ème élément.
  • Si l'échantillon contient un nombre pair d'éléments, la médiane se situe entre les deux éléments médians de l'échantillon et est égale à la moyenne arithmétique calculée sur ces deux éléments.

Pour calculer la médiane d'un échantillon de 15 fonds communs de placement à très haut risque, il faut d'abord trier les données brutes (figure 2). Alors la médiane sera opposée au numéro de l'élément médian de l'échantillon ; dans notre exemple numéro 8. Excel a une fonction spéciale =MEDIAN() qui fonctionne également avec des tableaux non ordonnés.

Riz. 2. Médiane 15 fonds

Ainsi, la médiane est de 6,5. Cela signifie que la moitié des fonds à très haut risque ne dépasse pas 6,5, tandis que l'autre moitié le dépasse. Notez que la médiane de 6,5 est légèrement supérieure à la médiane de 6,08.

Si nous supprimons la rentabilité du fonds RS Emerging Growth de l'échantillon, la médiane des 14 fonds restants diminuera à 6,2 %, c'est-à-dire moins significativement que la moyenne arithmétique (Fig. 3).

Riz. 3. Médiane 14 fonds

Mode

Le terme a été introduit pour la première fois par Pearson en 1894. La mode est le nombre qui apparaît le plus souvent dans l'échantillon (le plus à la mode). La mode décrit bien, par exemple, la réaction typique des conducteurs à un feu de circulation pour arrêter la circulation. Un exemple classique de l'utilisation de la mode est le choix de la taille du lot de chaussures produit ou de la couleur du papier peint. Si une distribution a plusieurs modes, on dit alors qu'elle est multimodale ou multimodale (a deux "pics" ou plus). La distribution multimodale fournit des informations importantes sur la nature de la variable étudiée. Par exemple, dans les enquêtes sociologiques, si une variable représente une préférence ou une attitude envers quelque chose, alors la multimodalité pourrait signifier qu'il existe plusieurs opinions distinctement différentes. La multimodalité est également un indicateur que l'échantillon n'est pas homogène et que les observations peuvent être générées par deux ou plusieurs distributions "chevauchées". Contrairement à la moyenne arithmétique, les valeurs aberrantes n'affectent pas le mode. Pour les variables aléatoires distribuées en continu, telles que les rendements annuels moyens des fonds communs de placement, le mode n'existe parfois pas du tout (ou n'a pas de sens). Étant donné que ces indicateurs peuvent prendre une variété de valeurs, les valeurs répétitives sont extrêmement rares.

quartiles

Les quartiles sont des mesures les plus couramment utilisées pour évaluer la distribution des données lors de la description des propriétés de grands échantillons numériques. Alors que la médiane divise le tableau ordonné en deux (50 % des éléments du tableau sont inférieurs à la médiane et 50 % sont supérieurs), les quartiles divisent l'ensemble de données ordonné en quatre parties. Les valeurs Q 1 , médiane et Q 3 sont respectivement les 25e, 50e et 75e centiles. Le premier quartile Q 1 est un nombre qui divise l'échantillon en deux parties : 25 % des éléments sont inférieurs à et 75 % sont supérieurs au premier quartile.

Le troisième quartile Q 3 est un nombre qui divise également l'échantillon en deux parties : 75 % des éléments sont inférieurs à et 25 % sont supérieurs au troisième quartile.

Pour calculer les quartiles dans les versions d'Excel antérieures à 2007, la fonction = QUARTILE (tableau, partie) a été utilisée. A partir d'Excel 2010, deux fonctions s'appliquent :

  • =QUARTILE.ON(tableau, partie)
  • =QUARTILE.EXC(tableau, partie)

Ces deux fonctions donnent des valeurs légèrement différentes (Figure 4). Par exemple, lors du calcul des quartiles d'un échantillon contenant des données sur le rendement annuel moyen de 15 fonds communs de placement à très haut risque, Q 1 = 1,8 ou -0,7 pour QUARTILE.INC et QUARTILE.EXC, respectivement. Soit dit en passant, la fonction QUARTILE utilisée précédemment correspond à la fonction moderne QUARTILE.ON. Pour calculer les quartiles dans Excel à l'aide des formules ci-dessus, le tableau de données peut être laissé non ordonné.

Riz. 4. Calculer les quartiles dans Excel

Insistons à nouveau. Excel peut calculer des quartiles pour univarié série discrète, contenant les valeurs d'une variable aléatoire. Le calcul des quartiles pour une distribution basée sur la fréquence est donné dans la section ci-dessous.

Moyenne géométrique

Contrairement à la moyenne arithmétique, la moyenne géométrique mesure l'évolution d'une variable au fil du temps. La moyenne géométrique est la racine nème degré du produit n valeurs (dans Excel, la fonction = CUGEOM est utilisée) :

g= (X 1 * X 2 * ... * X n) 1/n

Un paramètre similaire - la moyenne géométrique du taux de rendement - est déterminé par la formule :

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

R je- taux de retour je-ème période de temps.

Par exemple, supposons que l'investissement initial est de 100 000 $. À la fin de la première année, il tombe à 50 000 $ et, à la fin de la deuxième année, il retrouve les 100 000 $ d'origine. Le taux de rendement de cet investissement sur une période de deux ans la période de l'année est égale à 0, puisque le montant initial et le montant final des fonds sont égaux l'un à l'autre. Cependant, la moyenne arithmétique des taux de rendement annuels est = (-0,5 + 1) / 2 = 0,25 ou 25 %, puisque le taux de rendement de la première année R 1 = (50 000 - 100 000) / 100 000 = -0,5 , et dans le second R 2 = (100 000 - 50 000) / 50 000 = 1. Dans le même temps, la moyenne géométrique du taux de rendement sur deux ans est : G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Ainsi, la moyenne géométrique reflète plus précisément l'évolution (plus précisément, aucun changement) du volume des investissements au cours de l'exercice biennal que la moyenne arithmétique.

Faits intéressants. Premièrement, la moyenne géométrique sera toujours inférieure à la moyenne arithmétique des mêmes nombres. Sauf dans le cas où tous les nombres pris sont égaux entre eux. Deuxièmement, après avoir considéré les propriétés d'un triangle rectangle, on peut comprendre pourquoi la moyenne est appelée géométrique. La hauteur d'un triangle rectangle, abaissé à l'hypoténuse, est la moyenne proportionnelle entre les projections des jambes sur l'hypoténuse, et chaque jambe est la moyenne proportionnelle entre l'hypoténuse et sa projection sur l'hypoténuse (Fig. 5). Cela donne une manière géométrique de construire la moyenne géométrique de deux (longueurs) segments : il faut construire un cercle sur la somme de ces deux segments comme diamètre, puis la hauteur, restituée du point de leur raccordement à l'intersection avec le cercle, donnera la valeur désirée :

Riz. 5. La nature géométrique de la moyenne géométrique (figure de Wikipedia)

La deuxième propriété importante des données numériques est leur variation caractérisant le degré de dispersion des données. Deux échantillons différents peuvent différer à la fois en valeurs moyennes et en variations. Cependant, comme le montre la fig. 6 et 7, deux échantillons peuvent avoir la même variation mais des moyennes différentes, ou la même moyenne et une variation complètement différente. Les données correspondant au polygone B de la Fig. 7 changent beaucoup moins que les données à partir desquelles le polygone A a été construit.

Riz. 6. Deux distributions symétriques en forme de cloche avec le même écart et des valeurs moyennes différentes

Riz. 7. Deux distributions symétriques en forme de cloche avec les mêmes valeurs moyennes et une dispersion différente

Il existe cinq estimations de la variation des données :

  • envergure,
  • gamme interquartile,
  • dispersion,
  • écart-type,
  • le coefficient de variation.

portée

La plage est la différence entre les éléments les plus grands et les plus petits de l'échantillon :

Glisser = XMax-XMin

La fourchette d'un échantillon contenant des données sur les rendements annuels moyens de 15 fonds communs de placement à très haut risque peut être calculée à l'aide d'un tableau ordonné (voir la figure 4) : fourchette = 18,5 - (-6,1) = 24,6. Cela signifie que la différence entre les rendements annuels moyens les plus élevés et les plus bas pour les fonds à très haut risque est de 24,6 %.

La plage mesure la répartition globale des données. Bien que la plage d'échantillonnage soit une estimation très simple de la dispersion totale des données, sa faiblesse est qu'elle ne tient pas compte exactement de la manière dont les données sont réparties entre les éléments minimum et maximum. Cet effet est bien visible sur la Fig. 8 qui illustre des échantillons ayant la même plage. L'échelle B montre que si l'échantillon contient au moins une valeur extrême, la plage de l'échantillon est une estimation très imprécise de la dispersion des données.

Riz. 8. Comparaison de trois échantillons avec la même gamme ; le triangle symbolise le support de la balance, et son emplacement correspond à la valeur moyenne de l'échantillon

Gamme interquartile

La plage interquartile, ou moyenne, est la différence entre le troisième et le premier quartile de l'échantillon :

Intervalle interquartile \u003d Q 3 - Q 1

Cette valeur permet d'estimer l'étalement de 50% des éléments et de ne pas tenir compte de l'influence des éléments extrêmes. L'intervalle interquartile pour un échantillon contenant des données sur les rendements annuels moyens de 15 fonds communs de placement à très haut risque peut être calculé à l'aide des données de la Fig. 4 (par exemple, pour la fonction QUARTILE.EXC) : Etendue interquartile = 9,8 - (-0,7) = 10,5. L'intervalle entre 9,8 et -0,7 est souvent appelé la moitié médiane.

Il est à noter que les valeurs de Q 1 et Q 3, et donc l'écart interquartile, ne dépendent pas de la présence d'outliers, puisque leur calcul ne prend en compte aucune valeur qui serait inférieure à Q 1 ou supérieure à Q 3 . Les caractéristiques quantitatives totales, telles que la médiane, les premier et troisième quartiles et l'intervalle interquartile, qui ne sont pas affectées par les valeurs aberrantes, sont appelées indicateurs robustes.

Alors que la plage et la plage interquartile fournissent une estimation de la dispersion totale et moyenne de l'échantillon, respectivement, aucune de ces estimations ne tient compte exactement de la manière dont les données sont distribuées. Variance et écart type libre de ce défaut. Ces indicateurs permettent d'évaluer le degré de fluctuation des données autour de la moyenne. Écart d'échantillon est une approximation de la moyenne arithmétique calculée à partir des différences au carré entre chaque élément de l'échantillon et la moyenne de l'échantillon. Pour un échantillon de X 1 , X 2 , ... X n la variance de l'échantillon (notée par le symbole S 2 est donnée par la formule suivante :

En général, la variance de l'échantillon est la somme des différences au carré entre les éléments de l'échantillon et la moyenne de l'échantillon, divisée par une valeur égale à la taille de l'échantillon moins un :

- moyenne arithmétique, n- taille de l'échantillon, X je - je-ème élément échantillon X. Dans Excel avant la version 2007, la fonction =VAR() était utilisée pour calculer la variance de l'échantillon, depuis la version 2010, la fonction =VAR.V() est utilisée.

L'estimation la plus pratique et la plus largement acceptée de la dispersion des données est écart-type. Cet indicateur est désigné par le symbole S et est égal à la racine carrée de la variance de l'échantillon :

Dans Excel avant la version 2007, la fonction =STDEV() était utilisée pour calculer l'écart type, à partir de la version 2010 la fonction =STDEV.V() est utilisée. Pour calculer ces fonctions, le tableau de données peut être non ordonné.

Ni la variance de l'échantillon ni l'écart-type de l'échantillon ne peuvent être négatifs. La seule situation dans laquelle les indicateurs S 2 et S peuvent être nuls est celle où tous les éléments de l'échantillon sont égaux. Dans ce cas totalement improbable, l'intervalle et l'intervalle interquartile sont également nuls.

Les données numériques sont par nature volatiles. Toute variable peut prendre plusieurs valeurs différentes. Par exemple, différents fonds communs de placement ont des taux de rendement et de perte différents. En raison de la variabilité des données numériques, il est très important d'étudier non seulement les estimations de la moyenne, qui sont de nature sommative, mais aussi les estimations de la variance, qui caractérisent la dispersion des données.

La variance et l'écart-type nous permettent d'estimer la dispersion des données autour de la moyenne, c'est-à-dire de déterminer combien d'éléments de l'échantillon sont inférieurs à la moyenne et combien sont supérieurs. La dispersion a des propriétés mathématiques intéressantes. Cependant, sa valeur est le carré d'une unité de mesure - un pourcentage carré, un dollar carré, un pouce carré, etc. Par conséquent, une estimation naturelle de la variance est l'écart type, qui est exprimé dans les unités de mesure habituelles - pourcentage du revenu, dollars ou pouces.

L'écart type vous permet d'estimer la quantité de fluctuation des éléments de l'échantillon autour de la valeur moyenne. Dans presque toutes les situations, la majorité des valeurs observées se situent à plus ou moins un écart type de la moyenne. Par conséquent, connaissant la moyenne arithmétique des éléments de l'échantillon et l'écart type de l'échantillon, il est possible de déterminer l'intervalle auquel appartient la majeure partie des données.

L'écart-type des rendements de 15 fonds communs de placement à très haut risque est de 6,6 (figure 9). Cela signifie que la rentabilité de la majeure partie des fonds ne diffère pas de la valeur moyenne de plus de 6,6 % (c'est-à-dire qu'elle fluctue dans la plage allant de –S= 6,2 – 6,6 = –0,4 à +S= 12,8). En fait, cet intervalle contient un rendement annuel moyen sur cinq ans de 53,3 % (8 sur 15) des fonds.

Riz. 9. Écart type

Notez que lors du processus d'addition des différences au carré, les éléments les plus éloignés de la moyenne gagnent plus de poids que les éléments les plus proches. Cette propriété est la principale raison pour laquelle la moyenne arithmétique est le plus souvent utilisée pour estimer la moyenne d'une distribution.

Le coefficient de variation

Contrairement aux estimations de dispersion précédentes, le coefficient de variation est une estimation relative. Il est toujours mesuré en pourcentage, et non dans les unités de données d'origine. Le coefficient de variation, désigné par les symboles CV, mesure la dispersion des données autour de la moyenne. Le coefficient de variation est égal à l'écart type divisé par la moyenne arithmétique et multiplié par 100 % :

S- écart-type de l'échantillon, - moyenne de l'échantillon.

Le coefficient de variation permet de comparer deux échantillons dont les éléments sont exprimés dans des unités de mesure différentes. Par exemple, le responsable d'un service de livraison de courrier a l'intention de moderniser la flotte de camions. Lors du chargement des colis, il y a deux types de restrictions à considérer : le poids (en livres) et le volume (en pieds cubes) de chaque colis. Supposons que dans un échantillon de 200 sacs, le poids moyen est de 26,0 livres, l'écart type du poids est de 3,9 livres, le volume moyen du colis est de 8,8 pieds cubes et l'écart type du volume est de 2,2 pieds cubes. Comment comparer la répartition du poids et du volume des colis ?

Étant donné que les unités de mesure du poids et du volume diffèrent les unes des autres, le gestionnaire doit comparer la répartition relative de ces valeurs. Le coefficient de variation de poids est CV W = 3,9 / 26,0 * 100 % = 15 %, et le coefficient de variation de volume CV V = 2,2 / 8,8 * 100 % = 25 %. Ainsi, la dispersion relative des volumes de paquets est beaucoup plus grande que la dispersion relative de leurs poids.

Formulaire de distribution

La troisième propriété importante de l'échantillon est la forme de sa distribution. Cette distribution peut être symétrique ou asymétrique. Pour décrire la forme d'une distribution, il est nécessaire de calculer sa moyenne et sa médiane. Si ces deux mesures sont identiques, la variable est dite symétriquement distribuée. Si la valeur moyenne d'une variable est supérieure à la médiane, sa distribution a une asymétrie positive (Fig. 10). Si la médiane est supérieure à la moyenne, la distribution de la variable est asymétrique négativement. Une asymétrie positive se produit lorsque la moyenne augmente jusqu'à des valeurs anormalement élevées. Une asymétrie négative se produit lorsque la moyenne diminue jusqu'à des valeurs anormalement petites. Une variable est distribuée symétriquement si elle ne prend aucune valeur extrême dans les deux sens, de sorte que les grandes et les petites valeurs de la variable s'annulent.

Riz. 10. Trois types de distributions

Les données représentées sur l'échelle A ont une asymétrie négative. Cette figure montre une longue traîne et une inclinaison vers la gauche causées par des valeurs anormalement petites. Ces valeurs extrêmement petites déplacent la valeur moyenne vers la gauche et celle-ci devient inférieure à la médiane. Les données présentées sur l'échelle B sont réparties symétriquement. Les moitiés gauche et droite de la distribution sont leurs images miroir. Les grandes et les petites valeurs s'équilibrent, et la moyenne et la médiane sont égales. Les données affichées sur l'échelle B ont une asymétrie positive. Cette figure montre une longue traîne et un biais vers la droite, causés par la présence de valeurs anormalement élevées. Ces valeurs trop grandes déplacent la moyenne vers la droite, et celle-ci devient plus grande que la médiane.

Dans Excel, des statistiques descriptives peuvent être obtenues à l'aide du complément Forfait d'analyse. Parcourez le menu DonnéesL'analyse des données, dans la fenêtre qui s'ouvre, sélectionnez la ligne Statistiques descriptives et cliquez D'accord. Dans la fenêtre Statistiques descriptives n'oubliez pas d'indiquer intervalle d'entrée(Fig. 11). Si vous souhaitez voir les statistiques descriptives sur la même feuille que les données d'origine, sélectionnez le bouton radio intervalle de sortie et spécifiez la cellule où vous souhaitez placer le coin supérieur gauche des statistiques affichées (dans notre exemple, $C$1). Si vous souhaitez exporter des données vers une nouvelle feuille ou un nouveau classeur, sélectionnez simplement le bouton radio approprié. Cochez la case à côté de Statistiques finales. En option, vous pouvez également choisir Niveau de difficulté,k-ième plus petit etke plus grand.

Si en dépôt Données dans la région de Analyse vous ne voyez pas l'icône L'analyse des données, vous devez d'abord installer le module complémentaire Forfait d'analyse(voir, par exemple,).

Riz. 11. Statistiques descriptives des rendements annuels moyens sur cinq ans des fonds présentant des niveaux de risque très élevés, calculés à l'aide de l'add-on L'analyse des données Programmes Excel

Excel calcule un certain nombre de statistiques discutées ci-dessus : moyenne, médiane, mode, écart type, variance, plage ( intervalle), minimum, maximum et taille d'échantillon ( Chèque). De plus, Excel calcule pour nous de nouvelles statistiques : erreur standard, aplatissement et asymétrie. erreur standard est égal à l'écart type divisé par la racine carrée de la taille de l'échantillon. Asymétrie caractérise l'écart à la symétrie de la distribution et est une fonction qui dépend du cube des différences entre les éléments de l'échantillon et la valeur moyenne. L'aplatissement est une mesure de la concentration relative des données autour de la moyenne par rapport aux queues de la distribution, et dépend des différences entre l'échantillon et la moyenne élevée à la quatrième puissance.

Calcul de statistiques descriptives pour la population générale

La moyenne, la dispersion et la forme de la distribution décrites ci-dessus sont des caractéristiques basées sur un échantillon. Cependant, si l'ensemble de données contient des mesures numériques de l'ensemble de la population, ses paramètres peuvent être calculés. Ces paramètres comprennent la moyenne, la variance et l'écart type de la population.

Valeur attendue est égal à la somme de toutes les valeurs de la population générale divisée par le volume de la population générale :

µ - valeur attendue, Xje- je-ième observation variable X, N- le volume de la population générale. Dans Excel, pour calculer l'espérance mathématique, on utilise la même fonction que pour la moyenne arithmétique : =AVERAGE().

Écart démographiqueégale à la somme des écarts au carré entre les éléments de la population générale et mat. espérance divisée par la taille de la population :

σ2 est la variance de la population générale. Excel avant la version 2007 utilise la fonction =VAR() pour calculer la variance de la population, à partir de la version 2010 =VAR.G().

écart-type de la population est égal à la racine carrée de la variance de la population :

Excel avant la version 2007 utilise =STDEV() pour calculer l'écart type de la population, à partir de la version 2010 =STDEV.Y(). Notez que les formules pour la variance de la population et l'écart type sont différentes des formules pour la variance de l'échantillon et l'écart type. Lors du calcul des statistiques d'échantillon S2 et S le dénominateur de la fraction est n-1, et lors du calcul des paramètres σ2 et σ - le volume de la population générale N.

règle d'or

Dans la plupart des situations, une grande partie des observations sont concentrées autour de la médiane, formant un cluster. Dans les ensembles de données avec une asymétrie positive, ce groupe est situé à gauche (c'est-à-dire en dessous) de l'espérance mathématique, et dans les ensembles avec une asymétrie négative, ce groupe est situé à droite (c'est-à-dire au-dessus) de l'espérance mathématique. Les données symétriques ont la même moyenne et la même médiane, et les observations se regroupent autour de la moyenne, formant une distribution en forme de cloche. Si la distribution n'a pas une asymétrie prononcée et que les données sont concentrées autour d'un certain centre de gravité, une règle empirique peut être utilisée pour estimer la variabilité, qui dit : si les données ont une distribution en forme de cloche, alors environ 68 % des observations se situent à moins d'un écart-type de l'espérance mathématique, environ 95 % des observations se situent à moins de deux écarts-types de la valeur attendue et 99,7 % des observations se situent à moins de trois écarts-types de la valeur attendue.

Ainsi, l'écart-type, qui est une estimation de la fluctuation moyenne autour de l'espérance mathématique, aide à comprendre comment les observations sont distribuées et à identifier les valeurs aberrantes. Il découle de la règle empirique que pour les distributions en forme de cloche, seule une valeur sur vingt diffère de l'espérance mathématique de plus de deux écarts-types. Par conséquent, les valeurs en dehors de l'intervalle µ ± 2σ, peuvent être considérés comme des valeurs aberrantes. De plus, seules trois observations sur 1000 diffèrent de l'espérance mathématique de plus de trois écarts-types. Ainsi, les valeurs en dehors de l'intervalle µ ± 3σ sont presque toujours des valeurs aberrantes. Pour les distributions fortement asymétriques ou non en forme de cloche, la règle empirique de Biename-Chebyshev peut être appliquée.

Il y a plus de cent ans, les mathématiciens Bienamay et Chebyshev ont découvert indépendamment une propriété utile de l'écart type. Ils ont constaté que pour tout ensemble de données, quelle que soit la forme de la distribution, le pourcentage d'observations situées à une distance ne dépassant pas kécarts-types par rapport à l'espérance mathématique, pas moins (1 – 1/ 2)*100 %.

Par exemple, si k= 2, la règle de Bienamey-Chebyshev stipule qu'au moins (1 - (1/2) 2) x 100 % = 75 % des observations doivent se situer dans l'intervalle µ ± 2σ. Cette règle est vraie pour tout k dépassant un. La règle de Biename-Chebyshev est de nature très générale et est valable pour les distributions de toute nature. Il indique le nombre minimum d'observations, la distance à partir de laquelle l'espérance mathématique ne dépasse pas une valeur donnée. Cependant, si la distribution est en forme de cloche, la règle empirique estime plus précisément la concentration de données autour de la moyenne.

Calcul de statistiques descriptives pour une distribution basée sur la fréquence

Si les données d'origine ne sont pas disponibles, la distribution de fréquence devient la seule source d'information. Dans de telles situations, vous pouvez calculer les valeurs approximatives des indicateurs quantitatifs de la distribution, tels que la moyenne arithmétique, l'écart type, les quartiles.

Si les données de l'échantillon sont présentées sous forme de distribution de fréquence, une valeur approximative de la moyenne arithmétique peut être calculée, en supposant que toutes les valeurs de chaque classe sont concentrées au milieu de la classe :

- moyenne de l'échantillon, n- nombre d'observations, ou taille de l'échantillon, Avec- le nombre de classes dans la distribution de fréquence, mj- point médian j-ème classe, Fj- fréquence correspondant à j-ème classe.

Pour calculer l'écart type à partir de la distribution de fréquence, on suppose également que toutes les valeurs de chaque classe sont concentrées au milieu de la classe.

Pour comprendre comment les quartiles de la série sont déterminés en fonction des fréquences, considérons le calcul du quartile inférieur basé sur les données de 2013 sur la répartition de la population russe par revenu monétaire moyen par habitant (Fig. 12).

Riz. 12. La part de la population de la Russie avec un revenu monétaire par habitant en moyenne par mois, en roubles

Pour calculer le premier quartile de la série de variation d'intervalle, vous pouvez utiliser la formule :

où Q1 est la valeur du premier quartile, xQ1 est la borne inférieure de l'intervalle contenant le premier quartile (l'intervalle est déterminé par la fréquence cumulée, la première dépassant 25 %) ; i est la valeur de l'intervalle ; Σf est la somme des fréquences de l'ensemble de l'échantillon ; probablement toujours égal à 100 % ; SQ1–1 est la fréquence cumulée de l'intervalle précédant l'intervalle contenant le quartile inférieur ; fQ1 est la fréquence de l'intervalle contenant le quartile inférieur. La formule pour le troisième quartile diffère en ce que partout, au lieu de Q1, vous devez utiliser Q3 et remplacer ¾ au lieu de ¼.

Dans notre exemple (Fig. 12), le quartile inférieur est compris entre 7 000,1 et 10 000, dont la fréquence cumulée est de 26,4 %. La limite inférieure de cet intervalle est de 7000 roubles, la valeur de l'intervalle est de 3000 roubles, la fréquence cumulée de l'intervalle précédant l'intervalle contenant le quartile inférieur est de 13,4%, la fréquence de l'intervalle contenant le quartile inférieur est de 13,0%. Ainsi: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 roubles.

Les pièges associés aux statistiques descriptives

Dans cette note, nous avons examiné comment décrire un ensemble de données à l'aide de diverses statistiques qui estiment sa moyenne, sa dispersion et sa distribution. L'étape suivante consiste à analyser et interpréter les données. Jusqu'à présent, nous avons étudié les propriétés objectives des données, et nous nous tournons maintenant vers leur interprétation subjective. Deux erreurs guettent le chercheur : un sujet d'analyse mal choisi et une mauvaise interprétation des résultats.

L'analyse de la performance de 15 fonds communs de placement à très haut risque est assez impartiale. Il a abouti à des conclusions tout à fait objectives : tous les fonds communs de placement ont des rendements différents, l'écart des rendements des fonds varie de -6,1 à 18,5 et le rendement moyen est de 6,08. L'objectivité de l'analyse des données est assurée par le choix correct des indicateurs quantitatifs totaux de la distribution. Plusieurs méthodes d'estimation de la moyenne et de la dispersion des données ont été envisagées, et leurs avantages et inconvénients ont été indiqués. Comment choisir les bonnes statistiques qui fournissent une analyse objective et impartiale ? Si la distribution des données est légèrement asymétrique, faut-il choisir la médiane plutôt que la moyenne arithmétique ? Quel indicateur caractérise le plus précisément la dispersion des données : écart-type ou fourchette ? Faut-il indiquer l'asymétrie positive de la distribution ?

D'autre part, l'interprétation des données est un processus subjectif. Différentes personnes arrivent à des conclusions différentes, interprétant les mêmes résultats. Chacun a son propre point de vue. Quelqu'un considère que les rendements annuels moyens totaux de 15 fonds avec un niveau de risque très élevé sont bons et est assez satisfait des revenus perçus. D'autres peuvent penser que ces fonds ont des rendements trop faibles. Ainsi, la subjectivité devrait être compensée par l'honnêteté, la neutralité et la clarté des conclusions.

Questions éthiques

L'analyse des données est inextricablement liée aux questions éthiques. Il faut être critique vis-à-vis des informations diffusées par les journaux, la radio, la télévision et Internet. Au fil du temps, vous apprendrez à être sceptique non seulement sur les résultats, mais aussi sur les objectifs, le sujet et l'objectivité de la recherche. Le célèbre politicien britannique Benjamin Disraeli l'a dit le mieux : « Il y a trois sortes de mensonges : les mensonges, les maudits mensonges et les statistiques.

Comme indiqué dans la note, des questions éthiques se posent lors du choix des résultats qui doivent être présentés dans le rapport. Les résultats positifs et négatifs doivent être publiés. De plus, lors de la rédaction d'un rapport ou d'un rapport écrit, les résultats doivent être présentés de manière honnête, neutre et objective. Faites la distinction entre les présentations mauvaises et malhonnêtes. Pour ce faire, il est nécessaire de déterminer quelles étaient les intentions du locuteur. Parfois, le locuteur omet des informations importantes par ignorance, et parfois délibérément (par exemple, s'il utilise la moyenne arithmétique pour estimer la moyenne de données clairement biaisées afin d'obtenir le résultat souhaité). Il est également malhonnête de supprimer des résultats qui ne correspondent pas au point de vue du chercheur.

Les matériaux du livre Levin et al Statistiques pour les gestionnaires sont utilisés. - M. : Williams, 2004. - p. 178–209

Fonction QUARTILE conservée pour s'aligner sur les versions antérieures d'Excel

Excel a fait du calcul de la moyenne de plusieurs cellules une tâche très facile - il suffit d'utiliser la fonction MOYENNE(MOYENNE). Mais que se passe-t-il si certaines valeurs ont plus de poids que d'autres ? Par exemple, dans de nombreux cours, les tests ont plus de poids que les devoirs. Dans de tels cas, il faut calculer moyenne pondérée.

Excel n'a pas de fonction pour calculer la moyenne pondérée, mais il existe une fonction qui fera le plus gros du travail à votre place : SOMMEPROD(SOMME PRODUIT). Et même si vous n'avez jamais utilisé cette fonctionnalité auparavant, à la fin de cet article, vous l'utiliserez comme un pro. La méthode que nous utilisons fonctionne dans n'importe quelle version d'Excel ainsi que dans d'autres feuilles de calcul telles que Google Sheets.

Nous préparons la table

Si vous allez calculer une moyenne pondérée, vous aurez besoin d'au moins deux colonnes. La première colonne (colonne B dans notre exemple) contient les scores de chaque devoir ou test. La deuxième colonne (colonne C) contient les poids. Plus de poids signifie plus d'influence de la tâche ou du test sur la note finale.

Pour comprendre ce qu'est le poids, vous pouvez le considérer comme un pourcentage de votre note finale. En fait, ce n'est pas le cas, puisque dans ce cas, les poids devraient totaliser 100 %. La formule que nous analyserons dans cette leçon calculera tout correctement et ne dépendra pas de la somme des poids.

Nous entrons dans la formule

Maintenant que notre tableau est prêt, nous ajoutons la formule à la cellule B10(n'importe quelle cellule vide fera l'affaire). Comme pour toute autre formule dans Excel, nous commençons par un signe égal (=).

La première partie de notre formule est la fonction SOMMEPROD(SOMME PRODUIT). Les arguments doivent être mis entre parenthèses, nous les ouvrons donc :

SOMMEPROD(
=SOMMEPROD(

Ensuite, ajoutez les arguments de la fonction. SOMMEPROD(SUMPRODUCT) peut avoir plusieurs arguments, mais généralement deux sont utilisés. Dans notre exemple, le premier argument sera une plage de cellules. B2:B9 A qui contient les scores.

SOMMEPROD(B2:B9
=SOMMEPROD(B2:B9

Le deuxième argument sera une plage de cellules C2:C9, qui contient les poids. Ces arguments doivent être séparés par un point-virgule (virgule). Lorsque tout est prêt, fermez les parenthèses :

SOMMEPROD(B2:B9;C2:C9)
=SOMMEPROD(B2:B9,C2:C9)

Ajoutons maintenant la deuxième partie de notre formule, qui va diviser le résultat calculé par la fonction SOMMEPROD(SOMMEPROD) par la somme des poids. Nous verrons plus tard pourquoi c'est important.

Pour effectuer l'opération de division, nous continuons la formule déjà entrée avec le symbole / (barre droite), puis écrivez la fonction SOMME(SOMME):

SOMMEPROD(B2:B9;C2:C9)/SOMME(
=SOMMEPROD(B2:B9, C2:C9)/SOMME(

Pour la fonction SOMME(SOMME) nous ne spécifierons qu'un seul argument - une plage de cellules C2:C9. N'oubliez pas de fermer les parenthèses après avoir entré l'argument :

SOMMEPROD(B2:B9;C2:C9)/SOMME(C2:C9)
=SOMMEPROD(B2:B9, C2:C9)/SOMME(C2:C9)

Prêt! Après avoir appuyé sur la touche Entrer, Excel calculera la moyenne pondérée. Dans notre exemple, le résultat final sera 83,6 .

Comment ça fonctionne

Décomposons chaque partie de la formule, en commençant par la fonction SOMMEPROD(SOMMEPROD) pour comprendre comment cela fonctionne. Une fonction SOMMEPROD(SUMPRODUCT) calcule le produit du score de chaque élément et de son poids, puis additionne tous les produits résultants. En d'autres termes, la fonction trouve la somme des produits, d'où le nom. Donc pour Tâches 1 multiplier 85 par 5, et pour Teste multiplier 83 par 25.

Si vous vous demandez pourquoi nous devons multiplier les valeurs dans la première partie, imaginez que plus le poids de la tâche est important, plus nous devons en tenir compte. Par exemple, Tâche 2 compté 5 fois et Examen final- 45 fois. Voilà pourquoi Examen final a un plus grand impact sur le score final.

À titre de comparaison, lors du calcul de la moyenne arithmétique habituelle, chaque valeur n'est prise en compte qu'une seule fois, c'est-à-dire que toutes les valeurs ont le même poids.

Si vous pouviez regarder sous le capot d'une fonction SOMMEPROD(SOMMEPROD), nous avons vu qu'en fait elle croit ceci :

=(B2*C2)+(B3*C3)+(B4*C4)+(B5*C5)+(B6*C6)+(B7*C7)+(B8*C8)+(B9*C9)

Heureusement, nous n'avons pas besoin d'écrire une formule aussi longue car SOMMEPROD(SUMPRODUCT) fait tout cela automatiquement.

La fonction elle-même SOMMEPROD(SUMPRODUCT) nous renvoie un nombre énorme − 10450 . À ce stade, la deuxième partie de la formule entre en jeu : /SOMME(C2:C9) ou /SOMME(C2:C9), qui renvoie le résultat dans la plage normale des scores, donnant la réponse 83,6 .

La deuxième partie de la formule est très importante car permet de corriger automatiquement les calculs. N'oubliez pas que les pondérations ne doivent pas nécessairement totaliser 100 % ? Tout cela grâce à la deuxième partie de la formule. Par exemple, si nous augmentons une ou plusieurs valeurs de poids, la deuxième partie de la formule sera simplement divisée par la valeur la plus élevée, ce qui donnera à nouveau la bonne réponse. Ou nous pouvons rendre les poids beaucoup plus petits, par exemple en spécifiant des valeurs comme 0,5 , 2,5 , 3 ou 4,5 , et la formule fonctionnera toujours correctement. C'est génial, non ?

Le type de moyenne le plus courant est la moyenne arithmétique.

moyenne arithmétique simple

La moyenne arithmétique simple est le terme moyen, pour déterminer lequel le volume total d'un attribut donné dans les données est également réparti entre toutes les unités incluses dans cette population. Ainsi, la production annuelle moyenne par travailleur est une valeur du volume de production qui reviendrait à chaque employé si la totalité du volume de production était également répartie entre tous les employés de l'organisation. La valeur moyenne arithmétique simple est calculée par la formule :

moyenne arithmétique simple— Égal au rapport de la somme des valeurs individuelles d'une caractéristique au nombre de caractéristiques dans l'agrégat

Exemple 1 . Une équipe de 6 travailleurs reçoit 3 3,2 3,3 3,5 3,8 3,1 mille roubles par mois.

Trouver le salaire moyen
Solution : (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 mille roubles.

Moyenne pondérée arithmétique

Si le volume de l'ensemble de données est important et représente une série de distribution, une moyenne arithmétique pondérée est calculée. C'est ainsi que le prix moyen pondéré par unité de production est déterminé : le coût total de production (la somme des produits de sa quantité et le prix d'une unité de production) est divisé par la quantité totale de production.

Nous le représentons sous la forme de la formule suivante :

Moyenne arithmétique pondérée- est égal au rapport (la somme des produits de la valeur de l'attribut à la fréquence de répétition de cet attribut) à (la somme des fréquences de tous les attributs) Il est utilisé lorsque les variantes de la population étudiée se présentent de manière inégale nombre de fois.

Exemple 2 . Trouver le salaire moyen des employés de magasin par mois

Le salaire moyen peut être obtenu en divisant le salaire total par le nombre total de travailleurs :

Réponse : 3,35 mille roubles.

Moyenne arithmétique pour une série d'intervalles

Lors du calcul de la moyenne arithmétique d'une série de variations d'intervalle, la moyenne de chaque intervalle est d'abord déterminée comme la demi-somme des limites supérieure et inférieure, puis la moyenne de la série entière. Dans le cas d'intervalles ouverts, la valeur de l'intervalle inférieur ou supérieur est déterminée par la valeur des intervalles qui leur sont adjacents.

Les moyennes calculées à partir des séries d'intervalles sont approximatives.

Exemple 3. Déterminer l'âge moyen des élèves du département du soir.

Les moyennes calculées à partir des séries d'intervalles sont approximatives. Le degré de leur approximation dépend de la mesure dans laquelle la distribution réelle des unités de population dans l'intervalle tend vers l'uniformité.

Lors du calcul des moyennes, non seulement des valeurs absolues, mais également des valeurs relatives (fréquence) peuvent être utilisées comme pondérations:

La moyenne arithmétique a un certain nombre de propriétés qui révèlent plus complètement son essence et simplifient le calcul :

1. Le produit de la moyenne et de la somme des fréquences est toujours égal à la somme des produits de la variante et des fréquences, c'est-à-dire

2. La moyenne arithmétique de la somme des valeurs variables est égale à la somme des moyennes arithmétiques de ces valeurs :

3. La somme algébrique des écarts des valeurs individuelles de l'attribut par rapport à la moyenne est nulle :

4. La somme des écarts au carré des options par rapport à la moyenne est inférieure à la somme des écarts au carré de toute autre valeur arbitraire, c'est-à-dire

Idéal comme programme pour divers calculs. En règle générale, Excel est fourni avec le progiciel MS Office "office", qui est installé sur presque tous les ordinateurs. Mais peu de gens savent à quel point ce programme possède des fonctionnalités puissantes. Ayant étudié les bases d'Excel, il peut être appliqué dans presque tous les domaines d'activité. Ce programme est très utile aux écoliers pour résoudre des problèmes en mathématiques, physique, chimie, économie, etc. Par exemple, dans Excel, vous pouvez trouver rapidement et facilement la moyenne des nombres dont vous avez besoin.

Vidéo sur la moyenne

Comment trouver la moyenne dans Excel ?

Alors, comment la moyenne arithmétique est-elle généralement calculée ? Pour ce faire, et divisez par leur nombre total. Pour des problèmes très simples, cela suffit, mais dans tous les autres cas, cette option ne fonctionnera pas. Le fait est qu'en situation réelle les nombres changent toujours, le nombre de ces nombres aussi. Par exemple, un utilisateur dispose d'un tableau avec les notes des étudiants. Et vous devez trouver le score moyen de chaque élève. Il est clair que chacun d'eux aura des notes différentes, et le nombre de matières dans différentes spécialités et dans différents cours sera également différent. Il serait très stupide (et irrationnel) de suivre et de compter tout cela manuellement. Oui, et vous n'avez pas besoin de le faire, car Excel a une fonction spéciale qui vous aidera à trouver la moyenne de n'importe quel nombre. Même si elles changent de temps en temps, le programme recalculera automatiquement les nouvelles valeurs.

On peut supposer que l'utilisateur dispose d'un tableau déjà créé avec deux colonnes : la première colonne est le nom du sujet et la seconde est la note pour ce sujet. Et vous devez trouver le score moyen. Pour ce faire, utilisez l'assistant de fonction pour prescrire une formule de calcul de la moyenne arithmétique. Cela se fait tout simplement :

  1. Il est nécessaire de sélectionner et de sélectionner les éléments "Insérer - Fonction" dans la barre de menus.
  2. Une nouvelle fenêtre "Function Wizard" s'ouvrira, où dans le champ "Category" vous devez spécifier l'élément "Statistical".
  3. Après cela, dans le champ "Sélectionner une fonction", vous devez trouver la ligne "MOYENNE" (la liste entière est filtrée par ordre alphabétique, il ne devrait donc pas y avoir de problèmes avec la recherche).
  4. Ensuite, une autre fenêtre s'ouvrira dans laquelle vous devrez spécifier la plage de cellules pour laquelle la moyenne arithmétique sera calculée.
  5. Après avoir appuyé sur le bouton "OK", le résultat sera affiché dans la cellule sélectionnée.

Si maintenant, par exemple, vous modifiez une valeur pour l'un des éléments (ou le supprimez complètement et laissez le champ vide), alors Excel recalculera immédiatement la formule et donnera un nouveau résultat.

Autres façons de calculer la moyenne

Une autre façon de trouver la moyenne dans Excel consiste à utiliser la barre de formule.

Il se trouve juste en dessous de la barre de menus et juste au-dessus de la première ligne de la feuille de calcul Excel. C'est là qu'ils sont affichés. Par exemple, si vous cliquez sur une cellule où la valeur moyenne a déjà été calculée, alors dans la barre de formule, vous pouvez voir quelque chose comme ceci : =AVERAGE(B1:B6). Et un peu à gauche se trouve le bouton "fx", en cliquant sur lequel vous pouvez ouvrir une fenêtre familière pour sélectionner la fonction souhaitée.

Vous pouvez également prescrire toutes les formules manuellement. Pour ce faire, vous devez mettre le signe "=" dans n'importe quelle cellule sélectionnée, écrire manuellement la formule (MOYENNE), ouvrir le crochet, sélectionner la plage de cellules souhaitée et fermer le crochet. Le résultat s'affichera immédiatement.

C'est le moyen simple de calculer la valeur moyenne dans Microsoft Excel. De même, vous pouvez calculer la moyenne arithmétique uniquement pour les champs obligatoires, et non pour toute la plage de cellules. Pour ce faire, lors de la sélection d'une plage de cellules, il vous suffit de maintenir la touche "Ctrl" enfoncée et de cliquer alternativement sur chaque champ souhaité.

En mathématiques, la moyenne arithmétique des nombres (ou simplement la moyenne) est la somme de tous les nombres d'un ensemble donné divisée par leur nombre. C'est le concept le plus généralisé et répandu de la valeur moyenne. Comme vous l'avez déjà compris, pour trouver la valeur moyenne, vous devez additionner tous les nombres qui vous sont donnés et diviser le résultat par le nombre de termes.

Quelle est la moyenne arithmétique ?

Prenons un exemple.

Exemple 1. Des nombres sont donnés : 6, 7, 11. Vous devez trouver leur valeur moyenne.

Solution.

Trouvons d'abord la somme de tous les nombres donnés.

Maintenant, nous divisons la somme obtenue par le nombre de termes. Puisque nous avons trois termes, respectivement, nous allons diviser par trois.

Donc, la moyenne des nombres 6, 7 et 11 est 8. Pourquoi 8 ? Oui, car la somme de 6, 7 et 11 sera la même que trois huit. Cela se voit clairement sur l'illustration.

La valeur moyenne rappelle quelque peu "l'alignement" d'une série de nombres. Comme vous pouvez le voir, les piles de crayons sont devenues un niveau.

Prenons un autre exemple pour consolider les connaissances acquises.

Exemple 2 Les nombres sont donnés : 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Vous devez trouver leur moyenne arithmétique.

Solution.

On trouve la somme.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Divisez par le nombre de termes (dans ce cas, 15).

Par conséquent, la valeur moyenne de cette série de nombres est 22.

Considérons maintenant les nombres négatifs. Rappelons-nous comment les résumer. Par exemple, vous avez deux nombres 1 et -4. Trouvons leur somme.

1 + (-4) = 1 – 4 = -3

Sachant cela, considérons un autre exemple.

Exemple 3 Trouver la valeur moyenne d'une série de nombres : 3, -7, 5, 13, -2.

Solution.

Trouver la somme de nombres.

3 + (-7) + 5 + 13 + (-2) = 12

Puisqu'il y a 5 termes, nous divisons la somme obtenue par 5.

Par conséquent, la moyenne arithmétique des nombres 3, -7, 5, 13, -2 est 2,4.

À notre époque de progrès technologique, il est beaucoup plus pratique d'utiliser des programmes informatiques pour trouver la valeur moyenne. Microsoft Office Excel en fait partie. Trouver la moyenne dans Excel est simple et rapide. De plus, ce programme est inclus dans le progiciel de Microsoft Office. Considérez une brève instruction sur la façon de trouver la moyenne arithmétique en utilisant ce programme.

Pour calculer la valeur moyenne d'une série de nombres, vous devez utiliser la fonction MOYENNE. La syntaxe de cette fonction est :
=Moyenne(argument1, argument2, ... argument255)
où argument1, argument2, ... argument255 sont soit des nombres, soit des références de cellules (les cellules désignent des plages et des tableaux).

Pour que ce soit plus clair, testons les connaissances acquises.

  1. Entrez les nombres 11, 12, 13, 14, 15, 16 dans les cellules C1 - C6.
  2. Sélectionnez la cellule C7 en cliquant dessus. Dans cette cellule, nous afficherons la valeur moyenne.
  3. Cliquez sur l'onglet "Formules".
  4. Sélectionnez Plus de fonctions > Statistiques pour ouvrir la liste déroulante.
  5. Sélectionnez MOYENNE. Après cela, une boîte de dialogue devrait s'ouvrir.
  6. Sélectionnez et faites glisser les cellules C1-C6 pour définir la plage dans la boîte de dialogue.
  7. Confirmez vos actions avec le bouton "OK".
  8. Si vous avez tout fait correctement, dans la cellule C7, vous devriez avoir la réponse - 13,7. Lorsque vous cliquez sur la cellule C7, la fonction (=Moyenne(C1:C6)) s'affiche dans la barre de formule.

Il est très utile d'utiliser cette fonction pour la comptabilité, les factures ou lorsque vous avez simplement besoin de trouver la moyenne d'une très longue plage de nombres. Par conséquent, il est souvent utilisé dans les bureaux et les grandes entreprises. Cela vous permet de garder les dossiers en ordre et de calculer rapidement quelque chose (par exemple, le revenu moyen par mois). Vous pouvez également utiliser Excel pour trouver la moyenne d'une fonction.

Moyenne

Ce terme a d'autres sens, voir le sens moyen.

Moyenne(en mathématiques et statistiques) ensembles de nombres - la somme de tous les nombres divisée par leur nombre. C'est l'une des mesures les plus courantes de la tendance centrale.

Il a été proposé (avec la moyenne géométrique et la moyenne harmonique) par les pythagoriciens.

Les cas particuliers de la moyenne arithmétique sont la moyenne (de la population générale) et la moyenne de l'échantillon (des échantillons).

introduction

Dénoter l'ensemble de données X = (X 1 , X 2 , …, X n), alors la moyenne de l'échantillon est généralement indiquée par une barre horizontale sur la variable (x ¯ (\displaystyle (\bar (x))) , prononcé " X avec un tiret").

La lettre grecque μ est utilisée pour désigner la moyenne arithmétique de l'ensemble de la population. Pour une variable aléatoire pour laquelle une valeur moyenne est définie, μ est probabilité moyenne ou l'espérance mathématique d'une variable aléatoire. Si l'ensemble X est une collection de nombres aléatoires avec une moyenne de probabilité μ, alors pour tout échantillon X je de cette collection μ = E( X je) est l'espérance de cet échantillon.

En pratique, la différence entre μ et x ¯ (\displaystyle (\bar (x))) est que μ est une variable typique car vous pouvez voir l'échantillon plutôt que la population entière. Par conséquent, si l'échantillon est représenté de manière aléatoire (en termes de théorie des probabilités), alors x ¯ (\displaystyle (\bar (x))) (mais pas μ) peut être traité comme une variable aléatoire ayant une distribution de probabilité sur l'échantillon ( distribution de probabilité de la moyenne).

Ces deux quantités sont calculées de la même manière :

X ¯ = 1 n ∑ je = 1 n X je = 1 n (X 1 + ⋯ + X n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Si X est une variable aléatoire, alors l'espérance mathématique X peut être considérée comme la moyenne arithmétique des valeurs lors de mesures répétées de la quantité X. C'est une manifestation de la loi des grands nombres. Par conséquent, la moyenne de l'échantillon est utilisée pour estimer l'espérance mathématique inconnue.

En algèbre élémentaire, on prouve que la moyenne n+ 1 chiffres au-dessus de la moyenne n nombres si et seulement si le nouveau nombre est supérieur à l'ancienne moyenne, moins si et seulement si le nouveau nombre est inférieur à la moyenne, et ne change pas si et seulement si le nouveau nombre est égal à la moyenne. Le plus n, plus la différence entre les nouvelles et les anciennes moyennes est petite.

Notez qu'il existe plusieurs autres "moyennes" disponibles, y compris la moyenne de la loi de puissance, la moyenne de Kolmogorov, la moyenne harmonique, la moyenne arithmétique-géométrique et diverses moyennes pondérées (par exemple, la moyenne pondérée arithmétique, la moyenne pondérée géométrique, la moyenne pondérée harmonique) .

Exemples

  • Pour trois nombres, il faut les additionner et diviser par 3 :
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Pour quatre nombres, il faut les additionner et diviser par 4 :
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Ou plus facile 5+5=10, 10:2. Parce que nous avons ajouté 2 nombres, ce qui signifie que le nombre de nombres que nous ajoutons, nous le divisons par autant.

Variable aléatoire continue

Pour une valeur distribuée de façon continue f (x) (\displaystyle f(x)) la moyenne arithmétique sur l'intervalle [ a ; b ] (\displaystyle ) est défini via une intégrale définie :

F (x) ¯ [ une ; b ] = 1 b − une ∫ abf (x) dx (\displaystyle (\overline (f(x)))_()=(\frac (1)(ba))\int _(a)^(b) f(x)dx)

Quelques problèmes d'utilisation de la moyenne

Manque de robustesse

Article principal : Robustesse dans les statistiques

Bien que la moyenne arithmétique soit souvent utilisée comme moyenne ou tendance centrale, ce concept ne s'applique pas aux statistiques robustes, ce qui signifie que la moyenne arithmétique est fortement influencée par les "grands écarts". Il est à noter que pour les distributions avec une grande asymétrie, la moyenne arithmétique peut ne pas correspondre au concept de «moyenne», et les valeurs de la moyenne à partir de statistiques robustes (par exemple, la médiane) peuvent mieux décrire la tendance centrale.

L'exemple classique est le calcul du revenu moyen. La moyenne arithmétique peut être interprétée à tort comme une médiane, ce qui peut conduire à la conclusion qu'il y a plus de personnes avec plus de revenus qu'il n'y en a réellement. Le revenu "moyen" est interprété de telle manière que les revenus de la plupart des gens sont proches de ce chiffre. Ce revenu « moyen » (au sens de moyenne arithmétique) est supérieur au revenu de la plupart des gens, puisqu'un revenu élevé avec un écart important par rapport à la moyenne rend la moyenne arithmétique fortement biaisée (en revanche, le revenu médian « résiste » un tel biais). Cependant, ce revenu "moyen" ne dit rien sur le nombre de personnes proches du revenu médian (et ne dit rien sur le nombre de personnes proches du revenu modal). Cependant, si les concepts de « moyen » et de « majorité » sont pris à la légère, on peut conclure à tort que la plupart des gens ont des revenus supérieurs à ce qu'ils sont en réalité. Par exemple, un rapport sur le revenu net "moyen" à Medina, Washington, calculé comme la moyenne arithmétique de tous les revenus nets annuels des résidents, donnera un nombre étonnamment élevé dû à Bill Gates. Considérons l'échantillon (1, 2, 2, 2, 3, 9). La moyenne arithmétique est de 3,17, mais cinq des six valeurs sont inférieures à cette moyenne.

Intérêts composés

Article principal : ROI

Si les nombres multiplier, mais non plier, vous devez utiliser la moyenne géométrique et non la moyenne arithmétique. Le plus souvent, cet incident se produit lors du calcul du retour sur investissement en finance.

Par exemple, si les actions ont chuté de 10 % la première année et ont augmenté de 30 % la deuxième année, il est incorrect de calculer l'augmentation "moyenne" sur ces deux années comme la moyenne arithmétique (−10% + 30%) / 2 = 10 % ; la moyenne correcte dans ce cas est donnée par le taux de croissance annuel composé, à partir duquel la croissance annuelle n'est que d'environ 8,16653826392% ≈ 8,2%.

La raison en est que les pourcentages ont un nouveau point de départ à chaque fois : 30 % est 30 % à partir d'un nombre inférieur au prix au début de la première année : si l'action a commencé à 30 $ et a chuté de 10 %, elle vaut 27 $ au début de la deuxième année. Si le titre est en hausse de 30 %, il vaut 35,1 $ à la fin de la deuxième année. La moyenne arithmétique de cette croissance est de 10 %, mais comme le titre n'a augmenté que de 5,1 $ en 2 ans, une augmentation moyenne de 8,2 % donne un résultat final de 35,1 $ :

[30 $ (1 - 0,1) (1 + 0,3) = 30 $ (1 + 0,082) (1 + 0,082) = 35,1 $]. Si nous utilisons la moyenne arithmétique de 10 % de la même manière, nous n'obtiendrons pas la valeur réelle : [30 $ (1 + 0,1) (1 + 0,1) = 36,3 $].

Intérêt composé à la fin de l'année 2 : 90 % * 130 % = 117 % , soit une augmentation totale de 17 %, et l'intérêt composé annuel moyen est de 117 % ≈ 108,2 % (\displaystyle (\sqrt (117\%)) \approx 108.2\%) , soit une augmentation annuelle moyenne de 8.2%.

les directions

Article principal : Statistiques des destinations

Lors du calcul de la moyenne arithmétique d'une variable qui change cycliquement (par exemple, la phase ou l'angle), des précautions particulières doivent être prises. Par exemple, la moyenne de 1° et 359° serait 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Ce nombre est incorrect pour deux raisons.

  • Premièrement, les mesures angulaires ne sont définies que pour la plage de 0° à 360° (ou de 0 à 2π lorsqu'elle est mesurée en radians). Ainsi, la même paire de nombres pourrait s'écrire (1° et -1°) ou (1° et 719°). Les moyennes de chaque paire seront différentes : 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Deuxièmement, dans ce cas, une valeur de 0° (équivalente à 360°) serait la meilleure moyenne géométrique, puisque les nombres s'écartent moins de 0° que de toute autre valeur (la valeur 0° a la plus petite variance). Comparer:
    • le nombre 1° s'écarte de 0° de seulement 1° ;
    • le chiffre 1° s'écarte de la moyenne calculée de 180° de 179°.

La valeur moyenne d'une variable cyclique, calculée selon la formule ci-dessus, sera artificiellement décalée par rapport à la moyenne réelle vers le milieu de la plage numérique. Pour cette raison, la moyenne est calculée d'une manière différente, à savoir, le nombre avec la plus petite variance (point central) est choisi comme valeur moyenne. De plus, au lieu de soustraire, la distance modulo (c'est-à-dire la distance circonférentielle) est utilisée. Par exemple, la distance modulaire entre 1° et 359° est de 2° et non de 358° (sur un cercle entre 359° et 360°==0° - un degré, entre 0° et 1° - aussi 1°, au total - 2°).

Moyenne pondérée - qu'est-ce que c'est et comment la calculer?

Au cours de l'étude des mathématiques, les élèves se familiarisent avec le concept de moyenne arithmétique. À l'avenir, en statistique et dans certaines autres sciences, les étudiants seront également confrontés au calcul d'autres moyennes. Que peuvent-ils être et en quoi diffèrent-ils les uns des autres ?

Moyennes : signification et différences

Des indicateurs pas toujours précis permettent de comprendre la situation. Pour évaluer telle ou telle situation, il est parfois nécessaire d'analyser un grand nombre de chiffres. Et puis les moyennes viennent à la rescousse. Ils vous permettent d'évaluer la situation en général.

Depuis l'école, de nombreux adultes se souviennent de l'existence de la moyenne arithmétique. C'est très facile à calculer - la somme d'une séquence de n termes est divisible par n. Autrement dit, si vous devez calculer la moyenne arithmétique dans la séquence de valeurs 27, 22, 34 et 37, vous devez résoudre l'expression (27 + 22 + 34 + 37) / 4, puisque 4 valeurs ​​\u200b\u200sont utilisés dans les calculs. Dans ce cas, la valeur souhaitée sera égale à 30.

Souvent, dans le cadre du cursus scolaire, la moyenne géométrique est également étudiée. Le calcul de cette valeur est basé sur l'extraction de la racine du nième degré du produit de n termes. Si nous prenons les mêmes nombres : 27, 22, 34 et 37, alors le résultat des calculs sera 29,4.

La moyenne harmonique dans une école d'enseignement général ne fait généralement pas l'objet d'études. Cependant, il est utilisé assez souvent. Cette valeur est l'inverse de la moyenne arithmétique et est calculée comme un quotient de n - le nombre de valeurs et la somme 1/a 1 +1/a 2 +...+1/a n . Si nous reprenons la même série de nombres pour le calcul, l'harmonique sera alors 29,6.

Moyenne pondérée : fonctionnalités

Cependant, toutes les valeurs ci-dessus ne peuvent pas être utilisées partout. Par exemple, en statistique, lors du calcul de certaines valeurs moyennes, le "poids" de chaque nombre utilisé dans le calcul joue un rôle important. Les résultats sont plus révélateurs et corrects car ils prennent en compte plus d'informations. Ce groupe de valeurs est collectivement appelé la "moyenne pondérée". Ils ne sont pas transmis à l'école, il vaut donc la peine de s'y attarder plus en détail.

Tout d'abord, il convient d'expliquer ce que l'on entend par le "poids" d'une valeur particulière. La façon la plus simple d'expliquer cela est avec un exemple concret. La température corporelle de chaque patient est mesurée deux fois par jour à l'hôpital. Sur les 100 patients des différents services de l'hôpital, 44 auront une température normale - 36,6 degrés. 30 autres auront une valeur accrue - 37,2, 14 - 38, 7 - 38,5, 3 - 39 et les deux autres - 40. Et si nous prenons la moyenne arithmétique, alors cette valeur en général pour l'hôpital sera supérieure à 38 degrés ! Mais près de la moitié des patients ont une température tout à fait normale. Et ici, il serait plus correct d'utiliser la moyenne pondérée, et le "poids" de chaque valeur sera le nombre de personnes. Dans ce cas, le résultat du calcul sera de 37,25 degrés. La différence est évidente.

Dans le cas des calculs de moyenne pondérée, le "poids" peut être considéré comme le nombre d'expéditions, le nombre de personnes travaillant un jour donné, en général, tout ce qui peut être mesuré et affecter le résultat final.

Variétés

La moyenne pondérée correspond à la moyenne arithmétique discutée au début de l'article. Cependant, la première valeur, comme déjà mentionné, prend également en compte le poids de chaque nombre utilisé dans les calculs. En outre, il existe également des valeurs géométriques et harmoniques pondérées.

Il existe une autre variété intéressante utilisée dans les séries de nombres. Il s'agit d'une moyenne mobile pondérée. C'est sur sa base que les tendances sont calculées. Outre les valeurs elles-mêmes et leur poids, la périodicité y est également utilisée. Et lors du calcul de la valeur moyenne à un moment donné, les valeurs des périodes précédentes sont également prises en compte.

Le calcul de toutes ces valeurs n'est pas si difficile, mais en pratique, seule la moyenne pondérée habituelle est généralement utilisée.

Méthodes de calcul

À l'ère de l'informatisation, il n'est pas nécessaire de calculer manuellement la moyenne pondérée. Cependant, il serait utile de connaître la formule de calcul afin de pouvoir vérifier et, le cas échéant, corriger les résultats obtenus.

Il sera plus facile d'envisager le calcul sur un exemple précis.

Il est nécessaire de savoir quel est le salaire moyen dans cette entreprise, en tenant compte du nombre de travailleurs recevant un salaire particulier.

Ainsi, le calcul de la moyenne pondérée est effectué à l'aide de la formule suivante :

X = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Par exemple, le calcul serait :

X = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Évidemment, il n'y a pas de difficulté particulière à calculer manuellement la moyenne pondérée. La formule de calcul de cette valeur dans l'une des applications les plus populaires avec des formules - Excel - ressemble à la fonction SUMPRODUCT (série de nombres; série de poids) / SUM (série de poids).

Comment trouver la valeur moyenne dans excel?

comment trouver la moyenne arithmétique dans excel?

Vladimir09854

Peasy facile. Pour trouver la valeur moyenne dans Excel, vous n'avez besoin que de 3 cellules. Dans le premier, nous écrivons un numéro, dans le second - un autre. Et dans la troisième cellule, nous marquerons une formule qui nous donnera la valeur moyenne entre ces deux nombres des première et deuxième cellules. Si la cellule n ° 1 s'appelle A1, la cellule n ° 2 s'appelle B1, alors dans la cellule avec la formule, vous devez écrire comme ceci:

Cette formule calcule la moyenne arithmétique de deux nombres.

Pour la beauté de nos calculs, nous pouvons mettre en évidence les cellules avec des lignes, sous forme de plaque.

Il existe également une fonction dans Excel lui-même pour déterminer la valeur moyenne, mais j'utilise la méthode à l'ancienne et j'entre la formule dont j'ai besoin. Ainsi, je suis sûr qu'Excel calculera exactement ce dont j'ai besoin et ne proposera pas une sorte d'arrondi.

M3sergey

C'est très facile si les données sont déjà saisies dans les cellules. Si vous êtes juste intéressé par un nombre, sélectionnez simplement la plage/les plages souhaitées, et la valeur de la somme de ces nombres, leur moyenne arithmétique et leur nombre apparaîtront dans la barre d'état en bas à droite.

Vous pouvez sélectionner une cellule vide, cliquer sur le triangle (liste déroulante) "Somme automatique" et y sélectionner "Moyenne", après quoi vous serez d'accord avec la plage proposée pour le calcul, ou choisissez la vôtre.

Enfin, vous pouvez utiliser les formules directement - cliquez sur "Insérer une fonction" à côté de la barre de formule et de l'adresse de la cellule. La fonction MOYENNE se trouve dans la catégorie "Statistiques" et prend comme arguments à la fois des nombres et des références de cellules, etc. Là, vous pouvez également choisir des options plus complexes, par exemple, MOYENNESI - calcul de la moyenne par condition.

Trouver la moyenne dans Excel est une tâche assez simple. Ici, vous devez comprendre si vous souhaitez utiliser cette valeur moyenne dans certaines formules ou non.

Si vous n'avez besoin d'obtenir que la valeur, il suffit de sélectionner la plage de nombres requise, après quoi Excel calculera automatiquement la valeur moyenne - elle sera affichée dans la barre d'état, la rubrique "Moyenne".

Dans le cas où vous souhaitez utiliser le résultat dans des formules, vous pouvez faire ceci :

1) Additionnez les cellules à l'aide de la fonction SOMME et divisez le tout par le nombre de nombres.

2) Une option plus correcte consiste à utiliser une fonction spéciale appelée MOYENNE. Les arguments de cette fonction peuvent être des nombres donnés séquentiellement ou une plage de nombres.

Vladimir Tikhonov

encerclez les valeurs qui seront impliquées dans le calcul, cliquez sur l'onglet "Formules", vous y verrez "AutoSum" à gauche et à côté un triangle pointant vers le bas. cliquez sur ce triangle et choisissez "Moyenne". Voila, c'est fait) en bas de la colonne vous verrez la valeur moyenne :)

Ekaterina Mutalapova

Commençons par le début et dans l'ordre. Que signifie moyenne ?

La valeur moyenne est la valeur qui est la moyenne arithmétique, c'est-à-dire est calculé en ajoutant un ensemble de nombres, puis en divisant la somme totale des nombres par leur nombre. Par exemple, pour les nombres 2, 3, 6, 7, 2 ce sera 4 (la somme des nombres 20 est divisée par leur nombre 5)

Dans une feuille de calcul Excel, pour moi personnellement, le moyen le plus simple était d'utiliser la formule = MOYENNE. Pour calculer la valeur moyenne, vous devez entrer des données dans le tableau, écrire la fonction =AVERAGE() sous la colonne de données et, entre parenthèses, indiquer la plage de nombres dans les cellules, en mettant en surbrillance la colonne avec les données. Après cela, appuyez sur ENTREE ou cliquez simplement sur n'importe quelle cellule. Le résultat sera affiché dans la cellule sous la colonne. A première vue, la description est incompréhensible, mais en fait c'est une question de minutes.

Aventurier 2000

Le programme Excel est multi-facettes, il existe donc plusieurs options qui vous permettront de trouver la moyenne :

Première possibilité. Vous additionnez simplement toutes les cellules et divisez par leur nombre;

Deuxième option. Utilisez une commande spéciale, écrivez dans la cellule requise la formule "= MOYENNE (et spécifiez ici la plage de cellules)" ;

Troisième choix. Si vous sélectionnez la plage requise, notez que sur la page ci-dessous, la valeur moyenne dans ces cellules est également affichée.

Ainsi, il existe de nombreuses façons de trouver la valeur moyenne, il vous suffit de choisir celle qui vous convient le mieux et de l'utiliser constamment.

Dans Excel, en utilisant la fonction MOYENNE, vous pouvez calculer la moyenne arithmétique simple. Pour ce faire, vous devez entrer un certain nombre de valeurs. Appuyez sur égal et sélectionnez dans la catégorie Statistique, parmi lesquels sélectionnez la fonction MOYENNE

De plus, à l'aide de formules statistiques, vous pouvez calculer la moyenne pondérée arithmétique, qui est considérée comme plus précise. Pour le calculer, nous avons besoin des valeurs de l'indicateur et de la fréquence.

Comment trouver la moyenne dans Excel ?

La situation est la suivante. Il y a le tableau suivant :

Les colonnes ombrées en rouge contiennent les valeurs numériques des notes pour les matières. Dans la colonne "Moyenne", vous devez calculer leur valeur moyenne.
Le problème est le suivant : il y a 60 à 70 objets au total et certains d'entre eux se trouvent sur une autre feuille.
J'ai regardé dans un autre document, la moyenne a déjà été calculée, et dans la cellule il y a une formule comme
="nom de la feuille" !|E12
mais cela a été fait par un programmeur qui s'est fait virer.
Dites-moi, s'il vous plaît, qui comprend cela.

Hector

Dans la ligne des fonctions, vous insérez "MOYENNE" parmi les fonctions proposées et choisissez d'où elles doivent être calculées (B6 : N6) pour Ivanov, par exemple. Je ne suis pas sûr des feuilles voisines, mais cela est certainement contenu dans l'aide standard de Windows

Dites-moi comment calculer la valeur moyenne dans Word

Veuillez me dire comment calculer la valeur moyenne dans Word. À savoir, la valeur moyenne des notes, et non le nombre de personnes qui ont reçu des notes.

Ioulia Pavlova

Word peut faire beaucoup avec les macros. Appuyez sur ALT+F11 et écrivez un programme macro.
De plus, Insert-Object... vous permettra d'utiliser d'autres programmes, même Excel, pour créer une feuille avec un tableau à l'intérieur d'un document Word.
Mais dans ce cas, vous devez écrire vos chiffres dans la colonne du tableau et mettre la moyenne dans la cellule du bas de la même colonne, n'est-ce pas ?
Pour ce faire, insérez un champ dans la cellule du bas.
Insérer-Champ...-Formule
Contenu du champ
[= MOYENNE (AU-DESSUS)]
renvoie la moyenne de la somme des cellules ci-dessus.
Si le champ est sélectionné et que le bouton droit de la souris est enfoncé, il peut être mis à jour si les chiffres ont changé,
afficher le code ou la valeur du champ, modifier le code directement dans le champ.
En cas de problème, supprimez tout le champ de la cellule et recréez-le.
MOYENNE signifie moyenne, AU-DESSUS - environ, c'est-à-dire une rangée de cellules au-dessus.
Je ne savais pas tout cela moi-même, mais je l'ai trouvé facilement dans HELP, bien sûr, en réfléchissant un peu.