La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecánica subyacente de sistemas complejos.
PROBABILIDAD: NOCIONES BÁSICAS. AZAR y DESCONOCIMIENTO. El azar está relacionado con el desconocimiento. Un ejemplo nos puede ayudar; piense en un proceso industrial que produce grandes cantidades de un artículo determinado. No todos los artículos producidos son idénticos, cada artículo puede calificarse como "bueno'' o "defectuoso''. Si de toda la producción se escoge un artículo "a ciegas'', ese artículo puede resultar bueno o defectuoso. Esta es una situación azarosa (o aleatoria) y la parte esencial de este azar es que no sabemos si el artículo seleccionado es defectuoso. Claro que con experiencia en el proceso es posible cuantificar de una manera numérica qué tan probable es que el artículo sea defectuoso o nó.
AZAR e INCERTIDUMBRE. Hay otro concepto asociado al azar y es el de incertidumbre. Veamos un ejemplo. Respecto a una inversión, podemos estar contemplando invertir una cantidad de dinero. El retorno sobre la inversión puede ser fijo, como en el caso de una cuenta en un banco con interés fijo; pero pensemos en una empresa. El negocio puede resultar desde un gran éxito hasta un fracaso, es decir, la ganancia no es fija, sino que depende del éxito a obtener. Si no podemos evaluar qué tan factible es cada monto posible de la ganancia, tenemos una situación de incertidumbre. Por el contrario, si podemos tener una idea de qué tan probables son los diferentes resultados y entonces tendremos una situación de riesgo. Esta última es la que llamamos aleatoria o azarosa.ESPACIO MUESTRAL Y PROBABILIDAD. El párrafo anterior se resume diciendo que en las situaciones o experimentos aleatorios tenemos dos elementos esenciales: Una lista de posibilidades a futuro: espacio muestral Una cuantificación de la incertidumbre sobre esa lista de posibilidades: asignación de probabilidades. Cualquier problema o situación en la probabilidad, parte de esos dos elementos: Espacio Muestral y Probabilidades. ESPACIO MUESTRAL. El espacio muestral es el conjunto de todos los posibles resultados de un experimento o situación aleatoria. Si en una caja hay 10 manzanas y 2 están echadas a perder (¡al menos en este momento!), al extraer tres manzanas y ver cuántas son buenas podemos obtener 1, 2 o 3 buenas (¡0 buenas es imposible!). De modo que en este ejemplo el espacio muestral es: {1, 2, 3}. Si un juego consiste en tirar todas las aves que hagan falta hasta obtener tres perdoces seguidas o hasta que sean 15 aves, si nos fijamos en el número de aves requeridas, el espacio muestral es: { 3, 4, 5, . . . , 15 }. Pero si nos fijáramos en el número de disparos que resultan, entonces el espacio muestral es: {0, 1, 2,. . ., 15}. Es claro que para determinar el espacio muestral en un experimento aleatorio es necesario entender perfectamente: Qué se va a hacer. Qué se va a observar o contar.
EVENTOS o SUCESOS. Cuando se tiene un espacio muestral llamamos, formalmente evento o suceso a cualquier subconjunto del espacio muestral. Decimos que un suceso se realiza, cuando el resultado del experimento aleatorio es uno de los sucesos posibles. Las dos definiciones anteriores son muy abstractas. Veamos un par de s más utilizadas como por obtenerse de ella interesantes propiedades.
PROBABILIDAD CONDICIONADA Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La probabilidad condicional se escribe P(A|B), y se lee «la probabilidad de A dado B». No tiene por qué haber una relación causal o temporal entre A y B. A puede preceder en el tiempo a B, sucederlo o pueden ocurrir simultáneamente. A puede causar B, viceversa o pueden no tener relación causal. Las relaciones causales o temporales son nociones que no pertenecen al ámbito de la probabilidad. Pueden desempeñar un papel o no dependiendo de la interpretación que se le dé a los eventos. El condicionamiento de probabilidades puede lograrse aplicando el teorema de Bayes.
VARIABLE ALEATORIA En probabilidad y estadística, una variable aleatoria o variable estocástica es una variable estadística cuyos valores se obtienen de mediciones en algún tipo de experimento aleatorio. Formalmente, una variable aleatoria es una función, que asigna eventos (p.e., los posibles resultados de tirar un dado dos veces: (1, 1), (1, 2), etc.) a números reales (p.e., su suma). Los valores posibles de una variable aleatoria pueden representar los posibles resultados de un experimento aún no realizado, o los posibles valores de una cantidad cuyo valor actualmente existente es incierto (p.e., como resultado de medición incompleta o imprecisa). Intuitivamente, una variable aleatoria puede tomarse como una cantidad cuyo valor no es fijo pero puede tomar diferentes valores; una distribución de probabilidad se usa para describir la probabilidad de que se den los diferentes valores. Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores aleatorios como valores lógicos, funciones... El término elemento aleatorio se utiliza para englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el de proceso estocástico, un conjunto de variables aleatorias ordenadas (habitualmente por orden o tiempo).
TIPOS DE VARIABLES ALEATORIAS Para comprender de una manera más amplia y rigurosa los tipos de variables, es necesario conocer la definición de conjunto discreto. Un conjunto es discreto si está formado por un número finito de elementos, o si sus elementos se pueden enumerar en secuencia de modo que haya un primer elemento, un segundo elemento, un tercer elemento, y así sucesivamente.
Variable aleatoria discreta: un v. a. es discreta si su recorrido es un conjunto discreto. La variable del ejemplo anterior es discreta. Sus probabilidades se recogen en la función de cuantía (véanse las distribuciones de variable discreta). Variable aleatoria continua: una v.a. es continua si su recorrido no es un conjunto numerable. Intuitivamente esto significa que el conjunto de posibles valores de la variable abarca todo un intervalo de números reales. Por ejemplo, la variable que asigna la estatura a una persona extraída de una determinada población es una variable continua ya que, teóricamente, todo valor entre, pongamos por caso, 0 y 2,50 m, es posible.6 (véanse las distribuciones de variable continua) Variable aleatoria independiente: Supongamos que "X" e "Y" son variables aleatorias discretas. Si los eventos X = x / Y = y son variables aleatorias independientes. En tal caso: P(X = x, Y = y) = P( X = x) P ( Y = y). De manera equivalente: f(x,y) = f1(x).f2(y). Inversamente, si para todo "x" e "y" la función de probabilidad conjunta f(x, y) no puede expresarse sólo como el producto de una función de "x" por una función de "y" (denominadas funciones de probabilidad marginal de "X" e "Y" ), entonces "X" e "Y" son dependientes. Si "X" e "Y" son variables aleatorias continuas, decimos que son variables aleatorias independientes si los eventos "X ≤ x", e "Y ≤ y" y son eventos independientes para todo "x" e "y”. De manera equivalente: F(x,y) = F1(x).F2(y), donde F1(x) y F2(y) son las funciones de distribución (marginal) de "X" e "Y" respectivamente. Inversamente, "X" e "Y" son variables aleatorias dependientes si para todo "x" e "y" su función de distribución conjunta F(x,y) no puede expresarse como el producto de las funciones de distribución marginales de "X" e "Y". Para variables aleatorias independientes continuas, también es cierto que la función de densidad conjunta f(x, y) es el producto de las funciones densidad de probabilidad marginales de "X", f1(x), y de "Y", f2 (y).