Tengo un problema matemático relacionado con la espectrometría de masas de péptidos que no soy capaz de resolver por mí mismo. Espero que a algunos de vosotros os resulte un reto interesante. Lo he expresado a continuación en términos de cuentas de un collar para que, con suerte, no necesitéis entender la tecnología para resolver el problema.
Tienes bolsas que contienen un número casi infinito (para nuestros propósitos) de cuerdas con un número igual de cuentas; llamémoslas collares. Hay dos tipos de cuentas: blancas y negras. Hay una cierta abundancia de cuentas blancas y negras, respectivamente, que es la misma en todas las bolsas imaginables, y estas cuentas se distribuyen aleatoriamente en los collares. Los collares se sacan de la bolsa y se clasifican en categorías según el número de cuentas negras que contengan. Esto significa que para una bolsa con collares de longitud cinco (cinco cuentas) hay seis categorías:
w = white
b = black
0: wwwww
1: bwwww, wbwww, wwbww, wwwbw, wwwwb
2: bbwww, bwbww, bwwbw, bwwwb, wbbww, wbwbw, wbwwb, wwbbw, wwbwb, wwwbb
3: bbbww, bbwbw, bbwwb, bwbbw, bwbwb, bwwbb, wbbbw, wbbwb, wbwbb, wwbbb
4: wbbbb, bwbbb, bbwbb, bbbwb, bbbbw
5: bbbbb
Los collares tienen dirección, lo que significa que wwwwb no es idéntico a bwwww.
Cada categoría es más o menos abundante, dependiendo únicamente de la abundancia de cuentas negras y blancas, respectivamente. La suma de las abundancias relativas da 1:
I0 + I1 + I2 + I3 + I5 + ... = 1
Una vez ordenados los collares, un subconjunto de las primeras categorías (que contienen el menor número de cuentas negras; digamos la categoría 0-3, o 0-2) se separa del resto de collares y cada collar se corta una vez en una posición aleatoria, dando lugar a un montón de collares más pequeños, que llamaremos fragmentos. Estos se introducen de nuevo en nuevas bolsas en función de su nueva longitud y de si el fragmento es la parte derecha o izquierda del collar original. Así, todas y cada una de las nuevas bolsas contendrán fragmentos de idéntica longitud, aunque con distintas combinaciones de cuentas blancas y negras. Consideremos un fragmento de longitud cuatro en el que antes se eligió un subconjunto de la categoría 0-2:
0: wwww
1: bwww, wbww, wwbw, wwwb
2: bbww, bwbw, bwwb, wbwb, wwbb, wbbw
No se incluyen las categorías 3 y 4, ya que no se incluyeron en el subconjunto elegido en este escenario.
Considerando cualquiera de estas bolsas con fragmentos, la pregunta es: ¿Cuáles son las abundancias relativas de las distintas categorías? ¿Son iguales a las abundancias relativas si se hubiera elegido simplemente un collar de la longitud de los fragmentos y se hubiera escogido el mismo subconjunto?
Por ejemplo:
1. A bag with necklaces of length 16 is chosen.
A subset of category 0-2 (0-2 black beads) is chosen.
The necklaces in the subset are fragmented.
For a specific fragment of length 6 the relative abundances between the
catogories are I0, I1 and I2 (sum 1).
2. A bag with necklaces of length 6 is chosen.
A subset of category 0-2 (0-2 black beads) is chosen, which has the relative
abundances between the catogories I0', I1' and I2' (sum 1).
Is I0'=I0, I1'=I1, I'2=I2?
Avísame si necesitas algo más. A mí mismo me resulta difícil plantear esta cuestión de forma que sea fácilmente comprensible sin dejar de dar respuesta a la verdadera pregunta. Cualquier respuesta será muy apreciada.
EDIT1: Preguntas extra: ¿Y si introducimos más colores de cuentas? ¿Y si introducimos colores que cuenten como valor doble con respecto a la categoría (por ejemplo, una de estas cuentas en un collar aumentaría la categoría en 2 en lugar de 1)?