He comenzado a diseñar una implementación de un 8088 desde cero con el objetivo de ser el ciclo exacto. Puedo entender el razonamiento detrás de la número de ciclos de reloj para la mayoría de las instrucciones, sin embargo, debo decir que estoy bastante desconcertado por la Dirección Efectiva (EA) tiempo de cálculo.
Más específicamente, ¿por qué computación BP + DI o BX + SI toma 7 ciclos, pero computación BP + SI o BX + DI 8 ciclos? Tenga en cuenta que este es el número de ciclos para el conjunto de la EA de cálculo, que incluye un cambio además de añadir con un registro de segmento (es de suponer que esto toma un par de ciclos para mantener combinacional retrasos tan bajo como sea posible).
Yo sólo podía esperar para un determinado número de ciclos en mi diseño, pero estoy muy interesado en saber por qué hay este 1-ciclo de diferencia (y en general ¿por qué lleva tantos ciclos hacer cualquier EA cálculo, cuando un COMPLEMENTO entre registros es de tan solo 3 ciclos).