22 votos

Ejemplos de notación incorrecta y sus consecuencias

Un ejemplo de mala notación matemática que me viene a la mente y ha causado complicaciones a lo largo de la historia es la notación para los números imaginarios. La notación original utilizada para representar números imaginarios era "$\sqrt{-1}$", donde el símbolo de la raíz cuadrada se utilizaba para indicar la raíz cuadrada de un número negativo. Sin embargo, esta notación puede ser confusa y engañosa, ya que las raíces cuadradas de números negativos no pueden ser representadas como números reales.

El matemático suizo Leonhard Euler, a mediados del siglo XVIII, propuso una nueva notación para representar números imaginarios. Introdujo la letra "$i$" para representar la raíz cuadrada de $-1$ (es decir, $i^2 = -1$). Esta notación simplificó y aclaró la representación de números imaginarios, permitiendo una mejor comprensión y manipulación de ellos en cálculos y ecuaciones.

La notación original, utilizando el símbolo de la raíz cuadrada para los números imaginarios, llevó a malentendidos y confusiones en las matemáticas. Por ejemplo, la gente podría pensar que $\sqrt{-1}\cdot\sqrt{-1} = \sqrt{-1\cdot{-1}} = \sqrt1$, lo cual es claramente incorrecto cuando se trabaja con números imaginarios. La introducción de la notación "$i$" para los números imaginarios ayudó a resolver estos problemas y permitió un mayor desarrollo en el campo de las matemáticas complejas.

Estoy buscando otros ejemplos de mala notación y sus malas consecuencias.

Naturalmente, lo malo y lo bueno dependen del ojo que lo ve, pero estoy ansioso por escuchar a los amigos de esta comunidad sobre el tema y sus ejemplos, opiniones y referencias donde el tema se estudie académicamente.

9 votos

Esta es una buena pregunta para ChatGPT.

23 votos

No estoy de acuerdo en que $\sqrt{-1}$ sea necesariamente una mala notación. Puede ser pedagógicamente mala para principiantes matemáticamente inexpertos en números complejos, pero eso no es suficiente para descalificarla. Se podría argumentar que tiene cierto impacto shock, lo cual la convierte en un símbolo por sí misma, subconscientemente enterrado en la mente de cada matemático: te impacta incluso antes de digerir las otras partes de una fórmula. Muchos libros clásicos (e incluso más nuevos) sobre SVCs y Geometría Compleja la utilizan en lugar de $i$, lo que libera a este último para ser utilizado como un índice, por ejemplo, el libro de Donu Arapura, el libro de Griffiths y Harris, etc.

7 votos

Cont. De manera similar, tenemos, por ejemplo, la notación $\mathbb{Q}(\sqrt{-d})$ en la Teoría de Números Algebraicos, cuyo significado es inmediatamente claro.

16voto

amir Puntos 11

En mi opinión, las malas notaciones suelen ser notaciones confusas, con diferentes posibles significados.

Por ejemplo, el uso de paréntesis para muchas cosas puede ser confuso:

  • argumento de funciones,
  • prioridad en operaciones,
  • intervalos abiertos (prefiero la notación francesa $]a,b[)$
  • pares, tríos,...
  • matrices fila,
  • ciclos (permutaciones).

Me sentí muy perturbado cuando enseñaba sobre polinomios. Por ejemplo, $Q(X-\alpha)$ generalmente representa la composición $Q \circ (X-\alpha)$, mientras que $(X-\alpha)Q$ se usa para el producto. O al trabajar en aplicaciones lineales en $\mathbb{R}^n$, porque usamos la misma notación cuando multiplicamos un vector $(x_1,\ldots,x_n)$ por un número real o cuando aplicamos una aplicación a este vector.

El uso de superíndices que pueden ser malinterpretados como exponentes también es problemático. En mi opinión, la esfera unitaria euclidiana bidimensional debería ser denotada por $\mathbb{S}_2$ y no por $\mathbb{S}^2$.

En cálculo diferencial, cuando era estudiante, me desconcerté la primera vez que el profesor calculó la segunda diferencial de $g \circ f$ diferenciando $D(g \circ f) = (Dg \circ f) \circ Df$. Al intentar entender el cálculo, finalmente me di cuenta de que el símbolo $\circ$ usado dos veces en el lado derecho no tiene el mismo significado en las dos ocurrencias. La afirmación correcta es $D(g \circ f)(x) = Dg(f(x)) \circ Df(x)$ para todo $x$.

Ahora doy dos notaciones que tienen muchas ventajas, pero causan ocasionalmente problemas.

En teoría de la probabilidad, la notación intuitiva $f(X)$ para $f \circ X$ puede inducir en error, por ejemplo en la fórmula para calcular la esperanza condicional de una función acotada de dos variables aleatorias independientes $X$ e $Y$, es decir, $E[f(X,Y)|X] = g(X)$ donde $g(x):=E[f(x,Y)]$. Es muy tentador pero falso escribir $g(X)=E[f(X,Y)]$.

Los polinomios de matrices también conducen a confusiones, como la demostración falsa del teorema de Cayley Hamilton al reemplazar $X$ por $A$ en la igualdad $\chi_A(X) = \det(XI-A)$. Distinguir el $0$ en $K[X]$ del $0$ en $\mathcal{M}_n(K)$ es una forma sencilla de convencer a los estudiantes de que esta demostración es falsa.

Por último, odio las notaciones como $$f(x) = g(x), \quad x \in \mathbb{R},$$ que pueden significar $f(x) = g(x)$ para algún $x \in \mathbb{R}$, o $f(x) = g(x)$ para cada $x \in \mathbb{R}$, dependiendo de las circunstancias.

Una buena manera de prevenir muchos problemas es tener en cuenta:

  • las definiciones,
  • en qué conjuntos viven los objetos,
  • para qué elementos se cumplen las igualdades o propiedades.

9 votos

$D(g \circ f) = (Dg \circ f) \circ Df$. ¡¿Qué demonios?! Eso debería ser $D(g \circ f) = (Dg \circ f) \cdot Df$, entonces no hay nada malo en ello.

21 votos

El problema obvio con la notación francesa para los intervalos abiertos es el emparejamiento de corchetes; parece estar sintácticamente mal formado. Tu frase "(Prefiero la notación francesa $]a,b[$)" resalta este problema: parece que los conjuntos de corchetes coincidentes tienen la forma ($\ldots$] y [$\ldots$), lo cual no es lo que se pretendía. ]Aún peor sería tener un número negativo de corchetes abiertos.[

8 votos

Del mismo modo, "$a \leq x,y \leq b$" es un espectáculo de terror. Ambos posibles significados son ampliamente aceptados en la literatura.

15voto

Dean Hill Puntos 2006

Supongamos que $A$ es un oráculo; entonces es estándar escribir $\mathsf{P}^A$ para la clase de complejidad $\mathsf{P}$ relativa a $A$. Como he mencionado en otro lugar en MO, esta es una notación increíblemente confusa. Puede llevar al siguiente argumento espurio que ha confundido a generaciones de estudiantes. Supongamos que $\mathsf{P}=\mathsf{NP}$. Entonces para todos los oráculos $A$, $\mathsf{P}^A=\mathsf{NP}^A$. Pero por Baker–Gill–Solovay, sabemos que existe un oráculo $A$ tal que $\mathsf{P}^A\ne \mathsf{NP}^A$. Esto es una contradicción. Por lo tanto, $\mathsf{P}\ne \mathsf{NP}$.

1 votos

¿Tienes una solución preferida para esto? ¿Qué tal P^0 y NP^0?

2 votos

@user21820 Admito que no tengo una solución perfecta, pero creo que debería haber alguna forma de indicar que el oráculo se está aplicando al modelo de la máquina y no al lenguaje. Quizás algo como $\mathsf{P}_{T^A}$ en lugar de $\mathsf{P}^A$ donde $T$ simboliza el modelo de máquina de Turing. Uno aún podría usar $\mathsf{P}^A$ (o tal vez $\mathsf{P}_A$) por brevedad cuando no haya peligro de confusión, pero debería haber una forma de volver a una notación más precisa cuando sea necesario para evitar la confusión.

2 votos

Para beneficiar a alguien cuya última teoría de computabilidad fue en sus días de pregrado, ¿cuál es el paso incorrecto aquí? ¿Es que las clases de complejidad iguales no necesariamente tienen las mismas relativizaciones?

9voto

Ashley Clark Puntos 6806

Los elementos de los grupos (o monoides, semigrupos, álgebras no conmutativas) se componen de izquierda a derecha, funciones, mapas, funtores de derecha a izquierda. Las cosas se vuelven muy confusas cuando se trabaja, por ejemplo, con acciones del grupo simétrico (es aún peor cuando se usa la notación de ciclos). Creo que la notación polaca (argumentos primero) es una idea brillante pero probablemente sea demasiado tarde ahora para imponerla.

2 votos

Por el contrario ("probablemente ahora sea demasiado tarde para imponerlo") en teoría de semigrupos es muy común componer de derecha a izquierda, escribiendo primero los argumentos.

0 votos

Supongo que querías decir 'componer de izquierda a derecha' (¿de lo contrario tienes el mismo problema)? En teoría de grupos, también es común considerar acciones a la derecha (nunca puedo recordar esto: la derecha es con respecto al elemento del grupo).

1 votos

Lo que quiero decir es simplemente que, por ejemplo, en el monoide de transformación completa sobre un conjunto $X$ (siendo simplemente el conjunto de todas las funciones $f \colon X \to X$), se escribe $(x)fg$ para $(g \circ f)(x)$, con $x \in X$. Entonces, la multiplicación $fg$ corresponde a la composición de derecha a izquierda (¡a menos que se interprete lo contrario :)!).

4voto

Chris Puntos 26

1) Proceso de Ornstein–Uhlenbeck

Consideremos la EDS para el proceso de Ornstein–Uhlenbeck:

$$X_t:=X_0+\int_{h=0}^{h=t}\theta(\mu- X_h)dh + \int_{h=0}^{h=t}\sigma dW_h.$$

La solución se puede encontrar aplicando el lema de Itô a la función $F(X_t,t) := X_t e^{\theta t}$, lo que lleva a:

$$X_te^{\theta t}=X_0+\int_{h=0}^{h=t}\left(e^{\theta h}\theta\mu\right)dh+\int_{h=0}^{h=t}\left(e^{\theta h} \sigma\right)dW_h.$$

El paso final es aislar $X_t$ en el LHS dividiendo entre $e^{\theta t}$:

$$X_t=X_0e^{-\theta t}+\int_{h=0}^{h=t}\left(e^{\theta(h-t)}\theta\mu\right)dh+\int_{h=0}^{h=t}\sigma e^{\theta(h-t)} dW_h.$$

La notación abreviada para el proceso de Ornstein–Uhlenbeck lleva a confusión:

$$dX_t:=\theta(\mu- X_t)dt + \sigma dW_t.$$

Aplicando el lema de Itô y continuando en la notación abreviada lleva a:

$$d(X_te^{\theta t})=\left(e^{\theta t}\theta\mu\right)dt+\left(e^{\theta t} \sigma\right)dW_t.$$

Utilizando la notación abreviada, he visto a estudiantes cancelar erróneamente los términos $e^{\theta t}$ que normalmente se escribirían como $e^{\theta h}$ en la notación extendida dentro de las integrales.

2) Movimiento Browniano Geométrico

Incluso la muy conocida EDS para el Movimiento Browniano Geométrico escrita en notación abreviada lleva a confusión:

$$dS_t=\mu S_tdt+\sigma S_tdW_t$$

Nuevamente, los términos en el RHS normalmente se escribirían como $S_h$ dentro de una integral, lo que deja claro que los términos no se pueden "sacar" de la integral hasta que se integren.

En la notación abreviada, he visto con frecuencia intentos de dividir entre $S_t$ y escribir:

$$\frac{dS_t}{S_t}=\mu dt+\sigma dW_t$$

El "siguiente paso" sería entonces "integrar ambos lados" (¿con respecto a qué variable?) y escribir:

$$\ln(S_t)-\ln(S_0) = \mu t+\sigma W_t$$

Lo cual es claramente incorrecto (la solución es en realidad $\ln(S_t)-\ln(S_0) = \mu t - 0.5 \sigma^2 t + \sigma W_t$, nuevamente usando el lema de Itô).

En conclusión, argumentaría que la notación abreviada para las EDS es bastante desafortunada, especialmente para los nuevos estudiantes en el campo. Animaría a cualquiera nuevo en cálculo estocástico a usar la notación extendida hasta que se sientan muy cómodos con el tema.

3voto

MobileCushion Puntos 217

Littlewood, J. E., Un misceláneo matemático, Londres: Methuen & Co. VII, 136 p. 18 diagramas. (1953). ZBL0051.00101.

En la sección 12, Littlewood muestra dos pruebas de lo mismo. Primero una "prueba para principiantes" y luego una "prueba civilizada".

0 votos

19 votos

¿Podrías elaborar cómo esto encaja con la pregunta?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X