Estoy tratando de hacer algunas comparaciones basadas en porcentajes entre los diferentes grupos en un conjunto de datos de sentencias penales (http://dl.dropbox.com/u/1156404/wightCrimRecords.csv)
Tengo una información en un conjunto de la forma:
$Female
x
Burglary Criminal Damage and Arson
0.004950495 0.017326733
Driving Offences Murder
0.371287129 0.000000000
$Male
x
Burglary Criminal Damage and Arson
0.013001083 0.058504875
Driving Offences Murder
0.303358613 0.000000000
$`Not Stated`
x
Burglary Criminal Damage and Arson
0.0000000 0.0000000
Driving Offences Murder
0.1111111 0.0000000
Esto se derivó de los datos originales de la siguiente manera:
iw=read.csv("~/data/recordlevel.csv")
iwp=tapply(iw$Offence_type,iw$AGE,function(x){prop.table(table(x))})
Lo que me gustaría hacer es generar un único marco de datos que contenga una columna de género, una columna de frecuencia y filas correspondientes a Robo, Asesinato, etc.
Puedo extraer un único dato de la matriz multidimensional, por ejemplo, usando:
iwpF =data.frame(iwp['Female'])
que genera una fila separada para cada infracción y columnas referidas al tipo y frecuencia de la infracción, pero no puede ver cómo generar una única base de datos.
P.D. También me preguntaba si es posible extraer datos aún más estructurados, que por ejemplo cuenten los porcentajes de sexo del tipo de delito y el grupo de edad, así que por ejemplo podría buscar qué porcentaje de las condenas de los varones de más de 35 años están relacionadas con el asesinato.