Dado $n^2$ puntos uniformes i.i.d. en $[0,1]^2$ el objetivo es dibujar una configuración de $cn$ líneas verticales y $cn$ líneas horizontales tales que en cada pequeño rectángulo haya como máximo un punto marcado.
A continuación mostramos que $c$ debe satisfacer $c=\Omega(n^{1/3})$ para que esto sea típicamente posible:
De hecho, $\Theta(n^{4/3})$ son necesarias y suficientes para que dicha configuración exista con una probabilidad sustancial.
Más concretamente, denotemos por $p_n(k)$ la probabilidad de que una configuración de $k$ líneas verticales y $k$ las líneas horizontales separan $n^2$ puntos uniformes i.i.d. $\{x_j\}_{j=1}^{n^2}$ en $[0,1]^2$ .
Reclamación: Para constantes adecuadas $0<c_1<c_2<\infty$ tenemos (omitiendo los símbolos de la parte entera):
(a) $\; p_n(c_1 n^{4/3}) \to 0$ como $n \to \infty$ y
(b) $\; p_n(c_2 n^{4/3}) \to 1$ como $n \to \infty$ .
Esto se demuestra a continuación con $c_1=1/20$ y $c_2=3/2$ no se ha intentado optimizar estas constantes.
Prueba: Consideremos una malla auxiliar de $L:=n^{4/3}$ líneas verticales uniformemente espaciadas y $L$ líneas horizontales uniformemente espaciadas en el cuadrado de la unidad. Esta cuadrícula define $L^2$ cuadrados de cuadrícula de lado $1/L$ .
(a) Llamar a un cuadrado de la cuadrícula $Q$ agradable si contiene exactamente dos de los $n^2$ puntos dados $\{x_j\}$ . Obsérvese que para dos cuadrados de la cuadrícula distintos, los eventos que son agradables están correlacionados negativamente. Llamamos a un cuadrado agradable $Q$ bueno si hay como máximo otro cuadrado bonito en su fila y como máximo otro cuadrado bonito en su columna. La probabilidad de que un cuadrado específico de la cuadrícula $Q$ es agradable es $${n^2 \choose 2}L^{-4}(1-L^{-2})^{n^2-2}=(1/2+o(1))L^{-1}.$$
Dado que $Q$ es agradable, La expectativa condicional del número de cuadrados agradables (que no sean $Q$ ) en la fila de $Q$ es $1/2+o(1)$ Así, dado que $Q$ es agradable, la desigualdad de Markov implica que la probabilidad condicional de que haya dos o más cuadrados agradables adicionales en la fila de $Q$ (además $Q$ ) es, como máximo, de $1/4+o(1)$ . Lo mismo ocurre con la columna de $Q$ y deducimos que $$P(Q \; {\rm is \; good}\; | Q \; {\rm is \; nice}) \ge 1/2+o(1) \, ,$$ así que $$P(Q \; {\rm is \; good} ) \ge (1/4+o(1))L^{-1} \, .$$ Dejemos que $G$ denotan el número de cuadrículas buenas. Entonces la media satisface $$E(G) \ge (1/4+o(1))L \,.$$ Obsérvese que si sustituimos un punto $x_i$ por $x_i'$ entonces $G$ cambiará como máximo en 5, por lo que la desigualdad de Mcdiarmid, véase [1, Teorema 3.1] o [2], implica que para $n$ lo suficientemente grande, $$P(G \le L/5) \le \exp(-\frac{(L/21)^2}{25n^2}) \to 0 \,. {\rm as} \; n \to \infty \,.$$ (Como alternativa, se podría invocar la desigualdad de Efron-Stein o estimar la varianza directamente para comprobarlo). Supongamos ahora que $S$ es un conjunto de líneas verticales y horizontales que separan los puntos $\{x_j\}_{j=1}^{n^2}$ . Para cada cuadrícula buena $Q$ , una línea de $S$ es necesario para separar los dos puntos $x_i, x_j$ en el cuadrado, y cada una de esas líneas puede utilizarse como máximo para dos cuadrados buenos. Así, $|S| \ge G/2$ así que $$p_n(L/20) \le P(\exists \; {\rm separating } \; S \; {\rm with } \; |S| \le L/10) \le P(G \le L/5) \to 0 $$ .
(b) Denote por $M$ el número de pares $(i,j)$ tal que $1 \le i<j \le n^2$ y $x_i,x_j$ caen en la misma casilla de la cuadrícula. A continuación, $E(M) = {n^2 \choose 2}L^{-2} \le L/2$ y otra aplicación de la desigualdad de McDirarmid implica que $P(M \ge L) \to 0$ como $n \to \infty$ .
Por último, construye un conjunto de líneas de separación $S$ combinando el $2L$ líneas de la cuadrícula auxiliar con una línea de separación para cada par $(i,j)$ contados en $M$ (podemos tomar la mitad de estas líneas en vertical y la otra mitad en horizontal). A continuación, $P(|S| \ge 3L) \to 1$ como $n \to \infty$ y $p_n(3L/2) \to 1$ también.
[1] McDiarmid, Colin. "Concentración". En Probabilistic methods for algorithmic discrete mathematics, pp. 195-248. Springer, Berlín, Heidelberg, 1998. http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=8B1FFFE4553B63543AFEA0706E686E65?doi=10.1.1.168.5794&rep=rep1&type=pdf
[2] McDiarmid, C. (1989). "Sobre el método de las diferencias acotadas". Surveys in Combinatorics. London Math. Soc. Lectures Notes 141. Cambridge: Cambridge Univ. Press. pp. 148-188. MR 1036755
0 votos
¿Cuál es tu heurística para la sugerencia de que la probabilidad va a uno? Como comentario al margen, hay resultados que describen la asintótica del lado del mayor cuadrado vacío con lados paralelos a los de [0,1]^2. También existe una versión de rectángulos en lugar de cuadrados, creo. Sin embargo, la prueba no es de tipo LLN.
0 votos
@Vysotsky no es una heurística, sino una afirmación algo más débil que se puede observar experimentalmente y que se desprendería de la respuesta positiva a mi pregunta. La afirmación es que el grado de una curva tropical a través de n^2 puntos aleatorios en un cuadrado se concentra cerca de n.
0 votos
@Vysotsky ten en cuenta también que cortamos DESPUÉS de marcar los puntos al azar, por lo que hay más libertad.
0 votos
@Nikita Kalinin ¡Por supuesto, este es el punto principal (y la dificultad)! De lo contrario, la afirmación no funcionará, según los intentos de respuesta más abajo. No me queda claro por qué tu problema debería corresponder en cierto sentido a alguna ley de los grandes números.
0 votos
@Nikita Kalinin ¡Es un bonito problema! Pero de alguna manera comparto el escepticismo de Iosif Pinelis de que cn no sería suficiente. Tienes un algoritmo razonablemente rápido de cómo calcular los cortes para una realización dada de puntos, ¿no?