Si $B$ es un conjunto arbitrario, y $R$ es un anillo (en tu caso un campo, pero esta construcción no tiene nada que ver con campos; si no estás familiarizado con módulos simplemente reemplázalos con espacios vectoriales), entonces hay un $R$-módulo libre canónico $F(B)$ con una base que puede ser identificada con $B$. La idea es que los elementos deben parecerse a combinaciones lineales finitas de elementos en $B$ con coeficientes en $R, y que los coeficientes pueden ser vistos como una función que asigna a cada elemento de $B$ su coeficiente en $R. Más formalmente, el conjunto subyacente de $F(B)$ está definido como el conjunto de funciones $B \to R$ con soporte finito (recuerda que nuestras combinaciones lineales deben ser finitas). Este conjunto se convierte en un submódulo del módulo de todas las funciones $B \to R$, equipado con estructura de módulo punto a punto. Existe una inyección $i : B \to F(B)$ enviando $b \in B$ a la función que está soportada en $b$ y tiene valor $1$ allí. Es decir, $i(b)(b')=\delta_{b,b'}$ (delta de Kronecker). Para $\lambda \in F(B)$ tenemos $\lambda = \sum_{b \in B} \lambda(b) \cdot i(b)$. De esto se sigue que $i(B)$ es una base de $F(B), como se deseaba. Normalmente se escribe $b$ en lugar de $i(b)$.
Este módulo tiene una propiedad universal: Si $M$ es un $R$-módulo arbitrario y $j : B \to M$ es una función al conjunto subyacente, entonces hay un homomorfismo único $\alpha : F(B) \to M$ con $\alpha \circ i = j. Esto también se puede expresar como la afirmación de que $F(-) : \mathsf{Set} \to \mathsf{Mod}(R)$ es adjunto izquierdo al funtor olvidadizo. Esto simplemente significa que $F(B)$ es el mejor módulo que "aproxima" el conjunto $B.
Ahora para el producto tensorial: Si $R$ es un anillo conmutativo y $M,N$ son $R$-módulos, la idea es que $M \otimes_R N$ también debería consistir en sumas formales de elementos de la forma $m \otimes n$, pero queremos que estos tensores se comporten bilinealmente en cada variable. Y en la propiedad universal anterior, solo queremos poder extender mapas bilineales. Para lograr esto, considera $F(M \times N)$ y considera el submódulo generado por todas las relaciones bilineales (por ejemplo $(m+m',n)-(m,n)-(m',n)$, etc.), y deja que $M \otimes_R N$ sea el cociente. Entonces, por construcción, hay un mapa bilineal universal $M \times N \to M \otimes_R N. Es decir, siempre que $T$ sea un $R$-módulo y $M \times N \to T$ sea un mapa bilineal, se extiende de forma única a un mapa lineal $M \otimes_R N \to T. Cuando realmente quieras entender el producto tensorial, debes recordar esta propiedad universal. De hecho, esto sirve como una definición del producto tensorial. La estructura explícita de los elementos es bastante irrelevante para la mayoría de los problemas.