Antes de recopilar cualquier valor de datos sobre las variables característica y objetivo, estas variables pueden considerarse como variables aleatorias siempre que se utilice un mecanismo aleatorio para seleccionar a los sujetos que generarán estos valores. En ese caso, la notación correcta para estas variables es Y y X (es decir, letras mayúsculas para ambas).
Recuerde que el valor de una variable aleatoria es desconocido antes de recopilar los datos, aunque su comportamiento a largo plazo se puede predecir utilizando leyes de probabilidad. Sin embargo, una vez que recopilamos los datos, ese valor se vuelve conocido.
Después de recopilar todos los valores de datos deseados sobre las variables característica y objetivo, puede utilizar la notación en minúsculas para denotar la colección de valores de datos correspondientes a la variable objetivo (y) y las variables de característica (x). Si tiene una sola variable de característica, x es un vector de valores de datos. Si tiene varias variables de característica, x es una matriz de valores de datos, con una columna por variable de característica. Por lo general, y es un vector de valores de datos.
Entonces, la notación en mayúsculas se refiere a "aleatorio (por lo tanto, desconocido)", mientras que la notación en minúsculas se refiere a "conocido". Alternativamente, la notación en mayúsculas se refiere a "antes de recopilar los datos", mientras que la notación en minúsculas se refiere a "después de recopilar los datos".
Lamentablemente, la literatura no es en absoluto consistente en el uso de esta notación, por eso se puede ver la notación (y,X) que mencionas en tu pregunta.