No debería decir " ... para valores de X entre 1 y 10 ...", en lugar de "z" ?
¡Buena pregunta!
Hay una confusión con las Z's que figuran en el gráfico que tomé de Wikipedia, ya que hay dos Z’s distintas en juego. Dejame tratar de explicarlo renombrando las funciones.
No me quiero meter a dar una clase teórica, así que lo siguiente no pretende ser ni formal ni completo ni preciso. Hace años que estudié esto y no lo tengo tan fresco como para dar clase. A ver si lo logro aclarar…
Primero el concepto de que hay una función, la campana de Gauss que representa la probabilidad de que una variable
ALEATORIA CONTINUA tome un determinado valor. Es como se agrupan los individuos de una población según alguna característica medida por un
número Real.
Para una variable aleatoria discreta, por ejemplo tirar dos dados y ver cuanto suman, se puede graficar lo siguiente:

Y para 3 dados:

Se ve que empieza a tomar forma de campana. La campana de Gauss es una curva que modela la distribución para una variable aleatoria
CONTINUA.
Da la probabilidad de que un individuo tenga determinado valor.
Ese es el z que menciona el gráfico que tomé de Wikipedia, pero que genera confusión con otro Z que veremos después.
La función z(t) que figura allí representa a la curva de la campana de Gauss
ESTANDAR (después vuelvo sobre este término).
Mejor renombrar z(t) como f(x), entonces:
Función de densidad normal estandar: f(x) = (1/sqrt(2pi))e^(-x2/2)

Pero si bien en variable discreta (los dados) tiene sentido preguntarse la probabilidad de que tome un determinado valor exacto (que sume 7 digamos), eso no tiene sentido en variable continua. Por ello en variable continua lo que interesa es la integral (área debajo de la campana) en dos valores determinados.
Entonces diremos ¿Cuál es la probabilidad de que un individuo tenga un valor entre dos valores a y b. Entonces se define la función Integral, que es la realmente útil a nivel práctico.
2. Integral Normal
Esta Q(X) es lo que en el gráfico de Wikipedia figura como PHI(Z), la curva roja.
Como esta integral
no puede calcularse mediante funciones primitivas, siempre se han usado tablas para saber su valor. Con la computación digital se comenzaron a usar o bien cálculos mediante funciones que la aproximan, o bien algoritmos de cálculo numérico.
Hay que saber que el área total bajo la curva es 1, ya que representa probabilidades.
¿Por qué hablamos de ESTANDAR? (acá viene la segunda Z)Estándar quiere decir que se normalizó una curva para que pueda servir para cualquier media (mu) y desviación normal (sigma) que pueda tener una variable. Esto dado que diferentes muestras de diferentes variables tendrán diferentes campanas (en este gráfico usaron m pa la media, yo uso mu; y dt para la desviación, yo uso sigma):

La media define donde está centrada la campana, la desviación normal que tal alta o achatada es.
Ejemplo, si los alumnos de un curso se sacan notas parecidas y cercanas a 7 digamos estará centrada en mu=7 y será alta y angosta (desviación=sigma chico).
Si otro curso se saca notas de lo más variadas podría estar centrada en mu=5 y sería más chata y baja (desviación=sigma grande). Ambas pueden llevarse a una curva normal para simplificar la búsqueda en una única tabla de desviación normal estándar.
Otro ejemplo. Si nuestra variable representara los mililitros con que una embotelladora llena sus botellas de cerveza, quizás podría tener una media mu = 1010 ml, con una desviación estándar sigma = 9,5 ml.
Es posible llevar esto a una curva estandarizada para media = 0 y desviación estándar = 1. Esto se hace mediante la transformación:

donde:
mu = media (promedio)
sigma = desviación normal estándar
X = valor en ml a testear
Z = valor a testear transformado para curva ESTANDAR (este es el Z que puse en la escala D!)
Esto “le quita” la media y la desviación a nuestra variable X, y la transforma en una Z que sirve para la función ESTANDAR que tiene sigma=1 y mu=0.
Esa es la curva ESTANDAR.
Y con una sola curva podemos calcular para cualquier variable.
Por ejemplo ¿Cuál es la probabilidad en nuestro ejemplo de que una botella de cerveza termine llena con 1030 ml o más? Recordar que la embotelladora tiene mu = 1010 ml y Desviación estándar sigma = 9,5 ml.
Nos piden P(X>=1030)
Usamos que Z = (X-mu)/sigma para trasnformar a estandar.
Z = (1030 – 1010) / 9,5 = 2,11 (llevamos la X a Z para poder buscar en curva ESTANDAR)
Buscamos la integral de la cola derecha (por lo de mayor o igual) para Z = 2,11.
Es decir buscamos Q(2,11) = 1-PHI(2,11) (el area de la derecha es 1 menos el área desde -infinito a 2,11).

Buscando en la escala D=2,11 llegamos a la escala ND1 donde vemos que Q(2,11)=0,0175 = 1,75%
Hay un 1,75% de probabilidades de que una botella se llene con 1.030 ml o más.
Ese ejemplo sin normalizar se graficaría (el eje es X):

Mismo ejemplo normalizado se graficaría (el eje es Z):

Y la otra pregunta es: porqué graficar la "cola derecha" en lugar de la izquierda? Me parece que tiene más sentido saber la población "hasta el percentil", como muestra la zona sombreada de la gráfica ...
Se usan varias formas, todas son válidas. Elegí la que mas práctica me parece.
1) PHI(z) se define como el área desde -inf a z. Por ejemplo sirve para contestar la pregunta ¿Cuál es la probabilidad de encontrar botellas con menos de X mililitros?
2) Usar 1-PHI(z) como hice yo sirve para contestar la pregunta ¿Cuál es la probabilidad de encontrar botellas que tengan como mínimo X mililitros?
3) También se usan tablas que brindan el área entre dos valores -z a +z. ¿Cuál es la probabilidad de encontrar botellas que no se separen de la media en más de X mililitros? Este caso se calcularía P = PHI(Z)-PHI(-Z) , o con mi escala 1 – 2*(1-PHI(Z)), mas difícil escribirlo que hacerlo. Es 1 menos dos veces el valor de la cola derecha que da la escala.
Es fácil convertir de una forma a otra dado que el área bajo la curva es 1, y la curva de desviación normal estándar es simétrica y centrada en cero.No se si aclaré algo o generé mas confusión
Confundiaclaradores saludos