Es conveniente saber que si usted tiene un montón de series y, a continuación, hacer algo con estos conjuntos (por ejemplo, tomar su producto cartesiano), entonces el objeto que va a obtener va a ser todavía manejable. En otras palabras, queremos saber que podemos realizar muchas de las operaciones convenientes con los juegos que nos gustan y que aún permanecen en el mismo "universo" de los conjuntos que nos gusta. Russele la Paradoja demuestra claramente que esto no es nada trivial.
En teoría de conjuntos el universo de los conjuntos, o de un conjunto de discurso, se utiliza en dos formas diferentes. Ingenuamente, sólo se especifica un conjunto donde todos los elementos vienen de cuando se escribe $\forall$ o $\exists$. Por ejemplo, cuando se habla de números reales generalmente se supone que el conjunto del discurso es $\mathbb R$. En la teoría de conjuntos axiomática una especifica algunos de los axiomas de la teoría de conjuntos y, a continuación, en cuenta los modelos de los axiomas. Un modelo de los axiomas es en sí mismo un conjunto cuyos elementos son los conjuntos de que el modelo define. Así, " set " aquí se usa en dos formas muy diferentes. El universo es el conjunto $M$ que es el modelo de los axiomas de la teoría de conjuntos. Los elementos de $M$ son todos los conjuntos de que el modelo lo permite. El conjunto $M$ sí es, normalmente, no un elemento en $M$, por lo tanto no es un conjunto en el modelo.
En la categoría de la teoría es conveniente saber que, dado un montón de categorías podemos realizar muchas de las construcciones de ellos, como el de la formación de categorías de functors. Esto significa que el conjunto subyacente de la teoría empleamos debe ser lo suficientemente fuerte como para permitir que muchos de los "grandes" de las construcciones. Grothendieck introdujo la noción de una torre de universos de conjuntos para gestionar estas construcciones. Esto es necesario ya que las categorías típicas son grandes en el sentido de que sus objetos no forman un conjunto de la misma magnitud que el hom-conjuntos. Por ejemplo, para cualquiera de los dos grupos $G,H$ el hom-conjunto de todo el grupo homomorphisms $\psi:G\to H$ es de hecho un conjunto (incluso si los grupos son muy grandes). Así, a la hora de definir la categoría de $Grp$, cada hom-set es un conjunto, pero la clase de todos los grupos que no forman un conjunto. Hay, pues, una jerarquía, el uso de Grothendieck universos, de tamaños para las categorías y diversas construcciones pueden trascender el tamaño de las categorías que opera en, o puede que no, dependiendo de las construcciones.
En esa nota, la categoría de $Cat$ generalmente se refiere a la categoría de todas las categorías pequeñas, por lo que todas las categorías cuyos objetos forman un conjunto (en un nivel fijo de la torre de universos que se ambiente y supone fijo). Por lo tanto, la categoría de $Cat$ sí no es una categoría pequeña (evitando el tonto paradojas como la categoría de todas las categorías que contiene a sí mismo como un objeto). En su lugar, $Cat$ es una categoría mayor que cualquiera de las categorías que contiene (que tiene sentido). $Cat$ es todavía un objeto manejable con el uso de universos, sin embargo, la categoría de $CAT$ de todas las categorías es enorme y presenta muchas más dificultades que si uno realmente necesita para tratar con él.
Para ver la importancia de los problemas de tamaño en la categoría de teoría, recordemos que una categoría que se llama los pequeños completa si tiene todos los indexado límites, y que una categoría es un poset si entre dos cualesquiera de sus objetos hay en la mayoría de uno de morfismos. Hay un montón de pequeñas categorías completas (por ejemplo,, $Set$, $Grp$) que no son, evidentemente posets. Curiosamente, si uno mira a categorías completas (es decir, aquellos que tienen todos los límites, sin restricción de tamaño), entonces cualquier categoría deben ser de un poset.