Parte de la confusión proviene del uso de la preposición "en" para designar la pertenencia a un conjunto. En el uso cotidiano, "in" es una relación transitiva: Estoy en mi casa, que está situada en mi ciudad, así que estoy en mi ciudad. Sin embargo, los conjuntos son definido por lo que son sus miembros, y sería muy restrictivo considerar sólo conjuntos para que la pertenencia sea transitiva: siempre que $x$ es miembro de $y$ sería imposible construir un conjunto que tenga $y$ como miembro sin incluir también $x$ como miembro (así como los miembros que $x$ que pueda tener, etc.). Por lo tanto, siempre que $x\neq y$ las preguntas de si algún conjunto $~S$ tiene $x$ como miembro y si $S$ tiene $y$ como miembro son completamente independientes.
Existe una noción diferente, aunque relacionada, de que es transitivo: la relación de subconjunto (inclusión). Los números enteros incluyen los números pares, que incluyen el conjunto $\{4,144,1026\}$ por lo que ciertamente los enteros incluyen el conjunto $\{4,144,1026\}$ . Por definición $X$ incluye $Y$ es cada miembro de $Y$ también es miembro de $X$ . Confusamente, "contiene" puede referirse tanto a la pertenencia como a la inclusión, pero son relaciones muy diferentes; en la práctica, casi siempre está claro qué significado de "contiene" se quiere dar en cualquier situación concreta en la que se utilice.
De hecho, en la vida cotidiana la pertenencia no es una relación transitiva. El brazo izquierdo de mi hermana no es miembro de mi familia, aunque es miembro de un miembro de mi familia (disculpen el mal juego de palabras, pero no es tan fácil encontrar un ejemplo cotidiano de una colección de conjuntos; se podría pensar en algo como una asociación de equipos deportivos).